ミニマックスCEO:エッジモデルのインテリジェンスはGPT-4に匹敵、エージェント技術には時間が必要

MINIMAX7.42%

MiniMaxインテリジェンスのCEO、李大海は、2026年の北京志遠(Zhiyuan)カンファレンスで、エージェント技術は急速な進展がある一方で、冷静なアプローチが必要だと述べた。彭湃(Pengpai)ニュースや他のメディアに対し、李は、ゼロエラーのエージェントに対する一般の期待は、現状の技術開発のカーブが提供できる範囲を超えており、技術が成熟するまでにはまだ時間が必要だと説明した。彼は2025年をエージェントの初年度であると挙げ、爆発的な成長によって人類社会に深い影響が及ぶことを見込んだが、同時にAIエージェント分野における現在の技術能力を、落ち着いて評価する必要があると強調した。

李大海、エージェント技術の限界と急速な進化を語る

李大海は、大規模モデルとエージェント技術の統合が急速に進んでおり、すでに実用段階のシナリオも出てきていることを認めた。エージェントの限界について話す際、李は率直にこう述べた。「どこも問題だ。」さらに、「モデルとエージェント技術の進化は非常に速い」とし、「おそらく今日はいくつかの作業で10%の誤り率があり、来月には誤り率が1%まで下がる——急速な進化が中核的なトレンドになっている」と説明した。

MiniMax CEO、小型モデル蒸留の誤解を覆す

李大海は、業界で広く信じられている「良い小型モデルは、超大型の基盤モデルを蒸留することで作るべきだ」という考えに真正面から異議を唱え、「認知上の誤解だ」と呼んだ。彼はこう説明した。「蒸留の背後には非常に具体的な前提がある。蒸留そのものの対象である“蒸留元”自体が良いモデルでなければならない。蒸留とは本質的にこういうことだ。自社で基盤モデルを開発する能力がないが、アプリケーションを実装したい企業は、既存の小型の基盤モデルを採用し、微調整によって特定のシナリオ能力を得る。その過程で、他の大型モデルを用いてデータを合成し、小型モデルに対応する能力を獲得させることもあり得る。」李は、これは小型モデルに限らず、大規模モデルの学習におけるあらゆるパラダイムだと述べた。

MiniMax、学習負荷を国内のチップへ移行

李大海は明かした。「今年から業界全体として推論を国内チップに移した流れの中で、私たちも学習を徐々に国内チップと国内クラスターへ移していっている。」彼は、国内の計算能力(コンピュート)生態系を改善するための並行する2つの道筋を挙げた。1つ目はボトムアップの改良で、大規模モデル企業が自社の学習実践を通じて生態系を徐々に改善していくことで、「石のスラブ刃を少しずつ濡らしていくように、時間がかかる」。2つ目はトップダウンの計画で、MiniMaxが志遠研究院(Zhiyuan Research Institute)とFlagOSソフトウェア生態系において深く協力していることが例であり、大規模モデル企業とチップ企業が計画のもとで深く協力し、前進していく。MiniMaxインテリジェンスのAIInfra責任者、李玉軒は、推論は実際には学習よりも高い精度を必要とするとし、MiniMaxが提案したモデルスケーリング技術が重要なブレークスルーになったと指摘した。つまり、非常に小さなモデルで大規模モデルを予測する効果を実現し、国内チップでの深い評価を行い、実験の詳細を海外メーカーに合わせ、学習精度が実用に使えることを確認したという。MiniMaxは、Huaweiのプラットフォーム上で、極めて低いビット幅の量子化を意識した学習(quantization-aware training)を達成し、通常学習の効率の95%まで到達したと開示した。李大海は、5%の損失は量子化器そのもののオーバーヘッドによるものであり、Huaweiとの深い協力によってこのオーバーヘッドが最小化されたのだと説明した。

MiniCPM-5 1B、ArtificialAnalysisベンチマークでほぼGPT-4oの性能を達成

MiniMaxインテリジェンスは、MiniCPM Small Cannon fifth-generation 1B版が、権威あるArtificialAnalysis(AA)評価で17.9のスコアを達成したと発表した。オープンソースのコミュニティ研究者が比較したところ、2024年5月にリリースされたGPT-4o(200Bパラメータ)は同種の評価で18.3〜18.6を記録しており、2つの間の差はわずか0.4〜0.7ポイントだった。李大海はこう述べた。「2024年に、2026年末までにエッジモデルの知能レベルがGPT-4レベルに到達すると予測した。現時点のデータから、この目標は予定より前倒しで達成された。」

先の「MiniMaxオープンソースウィーク」の期間中、MiniMaxインテリジェンスは2つのエッジ向け大規模モデルをリリースした。MiniCPM5-1BとBitCPM-CANNである。MiniCPM5-1Bは、モデルの知能密度の上限を再び更新した。パラメータ規模はわずか1Bながら、国際的に有名なAA-Indexのリーダーボードで2B未満のすべてのモデルを上回った。3か月前にリリースされたQwen3.5-2Bと比べると、MiniCPM5-1Bは性能面だけでなく、パラメータを半減させてもいる。

ForgeTrain、AIで書かれたフレームワークでNVIDIA Megatronより10%速く学習

MiniCPM5-1Bモデルは、MiniMaxインテリジェンスの独自開発AI学習フレームワークForgeTrain AI-Written Frameworkによって事前学習された。ForgeTrain AI-Written Frameworkは、AIによって完全に書かれ、人間のプログラマーの関与が一切ない、世界初のプロダクション品質の大規模モデル事前学習フレームワークである。学習速度はNVIDIA Megatronより10%速い。

よくある質問(FAQ)

2026年の北京志遠(Zhiyuan)カンファレンスで、李大海はエージェント技術の限界について何と言っていましたか?

李大海は、ゼロエラーのエージェントに対する世間の期待は、現在の技術開発の到達範囲を超えており、技術が成熟するにはまだ時間が必要だと述べた。彼は現在のエージェントの限界を「どこも問題だ」と表現したが、一方で誤り率は急速に低下しており、場合によっては1か月で10%から1%へ下がっていると強調した。

ArtificialAnalysisベンチマークでのMiniCPM-5 1Bの性能はGPT-4oと比べてどうですか?

MiniCPM-5 1B(1Bパラメータ)はArtificialAnalysisの評価で17.9だったのに対し、GPT-4o(200Bパラメータ、2024年5月リリース)は同評価で18.3〜18.6を記録し、2つのモデルの差はわずか0.4〜0.7ポイントにとどまった。

ForgeTrainとは何で、NVIDIA Megatronと比べてどうですか?

ForgeTrainはMiniMaxインテリジェンスが独自開発したAI学習フレームワークForgeTrain AI-Written Frameworkであり、人間のプログラマーの関与が一切ないAIによって完全に書かれた、世界初のプロダクション品質の大規模モデル事前学習フレームワークだ。NVIDIA Megatronより10%速く学習できる。

免責事項:本ページの情報には第三者提供の内容が含まれる場合があり、参考目的のみで提供されています。これらはGateの見解や意見を示すものではなく、金融、投資、または法律上の助言を構成するものでもありません。暗号資産取引には高いリスクが伴います。意思決定を行う際には、本ページの情報のみに依存しないでください。詳細については、免責事項をご確認ください。
コメント
0/400
コメントなし