改良された価格性能比を備えた第8世代TPUチップをGoogleが発表。学習と推論を分離

Gate Newsのメッセージ、4月22日――Google Cloudは、4月22日に第8世代の独自設計TPU (Tensor Processing Unit)チップのリリースを発表した。新ラインアップには、AI学習タスク専用に設計されたTPU 8tと、AI推論ワークロード向けに最適化されたTPU 8iが含まれる。両チップは今年後半に提供開始となる。Googleはまた、AIエージェントを構築するための新しいツールを公開し、エンタープライズ向けAIの導入を後押しするための$750 百万ドル規模のファンドを発表した。

TPU 8tは、同価格帯でGoogleの従来世代のIronwood TPUに比べて2.8倍の性能を提供する。TPU 8iは、先代に比べて性能を80%向上させ、静的ランダムアクセスメモリ (SRAM)のアーキテクチャを組み込むことで、「費用対効果の高い大規模スループットと低レイテンシーを実現し、何百万ものエージェントを同時に稼働させられる」とCEOのスンダー・ピチャイは述べている。Ironwoodと比べて、TPU 8tとTPU 8iはいずれも、ワット当たりの性能効率が2倍以上を達成しており、TPU 8tは124%向上、TPU 8iは117%向上だ。Googleは技術スタック全体で電力効率を最適化し、リアルタイム需要に基づいて消費を調整するダイナミック電力管理システムも統合した。

Googleの自社モデルは、顧客向けAPIを直接呼び出すことで、毎分1600億トークン超を処理するようになった。これは前四半期の1000億から増加している。AIは現在、Googleにおける新規コードの75%を生成しており、昨年秋の50%と比べて増加している。Googleの法人向け提供であるGemini Enterpriseは、有料の月間アクティブユーザーで四半期比40%増となった。同社は、クラウド顧客とパートナーにより良い形でサービスを提供するため、2026年までに機械学習の計算(コンピュート)予算の半分強をクラウドサービスに投資する見込みだ。さらに、NVIDIAやAMDが提供する高価で供給制約のあるGPUの代替を求める大手テック企業の動きに合わせ、GoogleはBroadcomとの協業を拡大し、今後の世代向けのカスタムTPUチップの開発と供給を進めていく。

免責事項:このページの情報は第三者から提供される場合があり、Gateの見解または意見を代表するものではありません。このページに表示される内容は参考情報のみであり、いかなる金融、投資、または法律上の助言を構成するものではありません。Gateは情報の正確性または完全性を保証せず、当該情報の利用に起因するいかなる損失についても責任を負いません。仮想資産への投資は高いリスクを伴い、大きな価格変動の影響を受けます。投資元本の全額を失う可能性があります。関連するリスクを十分に理解したうえで、ご自身の財務状況およびリスク許容度に基づき慎重に判断してください。詳細は免責事項をご参照ください。

関連記事

OpenAIが、PII検出とマスクのためのオープンソース・プライバシーフィルターモデルを公開

概要:OpenAIのプライバシーフィルターはオープンソースで、ローカルで実行できるモデルで、テキスト内のPIIを検出してマスクします。大きなコンテキストに対応し、多くのPIIカテゴリを特定でき、データの準備、インデックス作成、ログ記録、モデレーションなどのプライバシー保護型ワークフローを想定しています。 OpenAIのプライバシーフィルターは、ローカルで実行されるオープンソースのモデル (128k-token context) で、テキスト内のPIIを検出してマスクし、プライバシーワークフローのために連絡先、金融、認証情報のデータをカバーします。

GateNews22分前

OpenAIは2030年までに計算能力30GWを展開する計画

OpenAIは、増大するAI需要に対応するため、2030年までに計算能力30GWを目指しており、2025年の目標10GWのうちすでに8GWを完了しています。この拡大は、次世代AIの開発とデプロイに向けてインフラを拡張する戦略を示しています。 OpenAIは、増加するAI需要に対応するため、2030年までに計算能力30GWに到達する意向であり、すでに2025年の目標10GWのうち8GWを完了しています。この動きは、次世代AIの開発とデプロイを支えるためのインフラを戦略的に拡大することを反映しています。

GateNews22分前

360のAI脆弱性発見エージェントが約1,000件のゼロデイ脆弱性のエクスプロイトを発見、Mythosと競合

360デジタルセキュリティのAI駆動型エージェントは、OfficeやOpenClawを含む約1,000件の新たな脆弱性を見つけたと主張しています。AIは現在、発見とエクスプロイト・チェーンの準備の中核となっており、Mythosに匹敵するとされています。 要旨:Bloombergで引用された報告によると、360デジタルセキュリティ・グループのAI駆動型「脆弱性発見エージェント」は、ここ数カ月で約1,000件の、これまで未確認だった脆弱性を特定しました。対象にはMicrosoft OfficeやOpenClawのフレームワークが含まれます。同社は、AIが脆弱性発見の中核エンジンになったとしており、エクスプロイト・チェーンの構築を加速するAIツールを発表したとしています。Benincasa氏は、Natto Thoughtsによる同社の中国語による発表内容のレビューに基づき、360をAnthropicのMythosの競合と位置付けています。

GateNews28分前

Yifan ZhangがDeepSeek V4の完全な技術仕様を開示:1.6Tパラメータ、6アクティベーション搭載の384人のエキスパート

Gate Newsの告知、4月22日——プリンストン大学の博士課程学生、Yifan Zhangが、4月19日の予告に続いてX上でDeepSeek V4の完全な技術仕様を明らかにした。V4は総パラメータ数1.6兆のほか、パラメータ2850億の軽量版V4-Liteを備える。 このモデルはDSA2

GateNews1時間前

AnthropicのCEOがホワイトハウスで初対面の場を設ける:首席補佐官、ベッセントと協議 Mythos

ウォール・ストリート・ジャーナルによると、Anthropic のCEO Amodei が 4/17 にホワイトハウスで非公開会談し、Mythos の国の安全に関する境界と責任ある展開に焦点を当てた。ホワイトハウスは、会議は建設的だったと述べ、市場は関係の緊張緩和と見ている。主な相違点は、軍が Claude をあらゆる合法的用途で使用することを求める一方で、Anthropic は、自社の許容する利用ポリシーの裁量を堅持していることだ。双方とも、対話を継続し、5月に Mythos がオンラインになる前に改めて話し合う意向を示した。

ChainNewsAbmedia2時間前

Google Ironwood TPU:10倍の性能 + 4つのパートナーがNvidiaに対抗

Bloombergの深掘り報道およびGoogle公式発表によると、Googleは4月22日、独自のAIチップ構成を正式に拡張しました。推論専用のIronwood(第7世代TPU)をGoogle Cloudで全面提供するとともに、Broadcom、MediaTek、Marvell、Intelの4社パートナーとの次世代設計協業もあわせて開始し、個別設計のチップ供給チェーンでNvidiaのAI演算能力市場における主導的地位に正面から挑みます。 Ironwood:第7世代TPU、初めて推論向けに設計 IronwoodはGoogleのTPUシリーズ第7世代製品であり、「学習・推論の分岐」戦略のもとで初めて推論専用として設計されたチップです。Googleが公開した仕様:単一チップのピーク性能はT

ChainNewsAbmedia2時間前
コメント
0/400
コメントなし