Google がオープンソースの DiffusionGemma を公開しました。速度は4倍ですが、品質は Gemma 4 に劣ります。

DiffusionGemma

Google DeepMind は 6 月 10 日に DiffusionGemma を正式に公開し、ソースコードもオープンソース化しました。Gemma 4 のオープンソース系統の新メンバーとして位置づけられます。DiffusionGemma は拡散式のテキスト生成アーキテクチャを採用し、混合専門家(MoE)の設計を組み合わせています。すべての公開済みのベンチマークテストで、DiffusionGemma のスコアは標準の Gemma 4 を下回っています。

公式の速度テストデータとハードウェア仕様

Google 公式が公開した確認数字によると:

速度テスト(Google 公式、第三者検証なし)

Nvidia RTX 5090(コンシューマ向け):約 700 token/秒

Nvidia H100(データセンター向け):1,000 token/秒を超える

自己評価倍率:同サイズの自己回帰 Gemma モデルの約 4 倍

アーキテクチャとパラメータ

総パラメータ数:260 億(26B)

推論時のアクティブパラメータ数:38 億(3.8B)

VRAM 要件:18GB VRAM の上位グレードのグラフィックカードで実行可能(量子化版では特にそうです)

最大並列処理:最大で 256 個の token を同時に処理

ライセンス:Apache 2.0

生成メカニズム:拡散式と自己回帰の中核的な違い

標準の自己回帰モデルは逐次的に 1 トークンずつ生成し、各 token は前のトークンの計算結果に依存します。ボトルネックはメモリ帯域で、1 トークン出力するたびにモデルの重みをメモリから読み込む必要があります。

DiffusionGemma の流れは異なります。まず出力領域全体にプレースホルダーの token を敷き詰め、複数ラウンドの脱ノイズを行います。各ラウンドでは、すべての位置の token が同時に更新され、互いを修正しながら、領域全体の内容が最終出力に収束するまで繰り返します。この計算量が大きい並列計算方式により、ボトルネックはメモリ帯域から GPU の演算能力へと移り、現代 GPU の並列性をより最大限に活用できます。

Google は公式ドキュメントで、数独のような非線形ロジック課題の解法において、DiffusionGemma は構造的な優位性を持つと例示しています。こうした課題では、正しい解答が複雑な位置間の依存関係を含むことが多く、自己回帰の線形生成方式は本質的に制約を受けやすいためです。

ベンチマーク結果:公開済みのテストスコアはすべて Gemma 4 より低い

Google は発表資料の中で、公開済みのすべての公開ベンチマークテストにおいて DiffusionGemma のスコアが標準の Gemma 4 を下回ることを確認しています。これは、4 倍の速度向上と引き換えに、生成品質が体系的に低下することを意味します。BlockTempo の記事では、このトレードオフは用途によって全く異なる意味を持つと指摘しています。遅延に敏感、または大量の出力が必要な場面では速度の優位性が現実的です。一方で品質への要求が高いタスクでは、現時点で標準の Gemma 4 のほうがより信頼できます。

Google 公式が挙げている DiffusionGemma の適用シーンには、インライン編集(in-line editing)、分子配列の生成、数学の描画、さらに複雑な論理的な依存関係を含む非線形タスクなどがあります。

よくある質問

DiffusionGemma と標準の自己回帰型言語モデルは、生成メカニズムにおいて本質的に何が違いますか?

標準の自己回帰モデルは逐次的に線形生成を行い、各 token は前の結果に依存します。DiffusionGemma はまず出力領域全体にプレースホルダーの token を埋め、複数回の脱ノイズを実施します。各ラウンドではすべての位置が同時に更新され、最終的には 1 回で全文を出力して仕上げます。生成ロジックは Stable Diffusion が画像を生成する方法により近いものになっています。

DiffusionGemma はローカルでどんなハードウェアに載せて動かせますか?

Google 公式の説明によれば、DiffusionGemma は 18GB VRAM の上位グレードのグラフィックカードで動作可能で、特に量子化版ではその傾向が強いとのことです。Google の公式テストでは、コンシューマ向けの Nvidia RTX 5090 で 1 秒あたり約 700 token まで到達できるとされていますが、上記の数字は Google の自己評価であり、第三者による独立検証ではありません。

DiffusionGemma の速度数値は第三者の検証をすでに通過していますか?

いいえ。BlockTempo は、すべての速度テストの数値が Google の公式テストに基づくものであり、第三者による独立検証ではないと明確に述べています。さらに、異なるシーンや異なる生成長さの条件下では、実際の倍率が公式数字とずれる可能性があります。

免責事項:本ページの情報には第三者提供の内容が含まれる場合があり、参考目的のみで提供されています。これらはGateの見解や意見を示すものではなく、金融、投資、または法律上の助言を構成するものでもありません。暗号資産取引には高いリスクが伴います。意思決定を行う際には、本ページの情報のみに依存しないでください。詳細については、免責事項をご確認ください。
コメント
0/400
コメントなし