Google DeepMindがGemma 4 12Bをリリース、16GBのGPUメモリ上で動作するオープンソースのマルチモーダルモデル

Google DeepMindは本日、オープンソースのマルチモーダルAIモデル「Gemma 4 12B」をリリースしました。 120億パラメータのモデルは、より大きい26BのMixture of Expertsモデルと同等の性能を提供しながら、必要なメモリは半分未満で、16GBのVRAMだけで、エントリーレベルのMacBook Air M5デバイスを含む一般向けノートPC上で動作できます。

Gemma 4 12Bは、Gemma 4シリーズでネイティブの音声入力に対応する最初のミドルサイズモデルです。 このモデルは、別個のビジョンおよびオーディオエンコーダを備えない軽量なアーキテクチャを特徴としており、低遅延とメモリ使用量の削減を可能にします。 マルチステップの推論、Agentのワークフロー、そして完全にオフラインでのローカル推論をサポートします。 このモデルはApache 2.0ライセンスのもとで公開され、学習済みの重みはHugging FaceおよびKaggleで利用可能で、Model Garden、Cloud Run、GKEを含むGoogle Cloudの各プラットフォームを介してデプロイできます。

免責事項:本ページの情報には第三者提供の内容が含まれる場合があり、参考目的のみで提供されています。これらはGateの見解や意見を示すものではなく、金融、投資、または法律上の助言を構成するものでもありません。暗号資産取引には高いリスクが伴います。意思決定を行う際には、本ページの情報のみに依存しないでください。詳細については、免責事項をご確認ください。
コメント
0/400
コメントなし