MiniMax 執行長：Edge 模型智慧比擬 GPT-4，代理技術需要時間

2026-06-15 06:12:28

MiniMax Intelligence 執行長李大海在 2026 北京致遠會議上表示，儘管技術進展迅速，但代理（agent）技術仍需要採取審慎的方式。李在接受澎湃新聞及其他媒體採訪時解釋，公眾對「零錯誤代理」的期待超出了目前技術發展曲線所能交付的範圍，因為該技術仍需要時間成熟。他指出 2025 年是代理的第一年，預期將出現爆炸式成長，並深刻影響人類社會；不過，他強調仍需對當前 AI 代理領域的技術能力做冷靜評估。

李大海闡述代理技術限制與快速演進

李大海承認，大模型與代理技術的融合正在快速演進，部分情境已落地於實際應用。談及代理限制時，李直言不諱：「到處都是問題。」他進一步說明：「模型與代理技術的演進非常快」，並指出：「或許今天某些工作有 10% 的錯誤率，下個月錯誤率下降到 1% — 快速演進已成為核心趨勢。」

MiniMax 執行長反駁小模型蒸餾誤解

李大海直面業界普遍認為「做出優秀的小模型必須來自對超大規模基礎模型的蒸餾」這一觀點，稱其為「認知誤解」。他解釋：「蒸餾背後有一個非常具體的前提：被蒸餾的對象本身必須是一個好模型。蒸餾本質上是：對於那些自身沒有能力開發基礎模型，但又想做應用落地的公司，他們會採用既有的小規模基礎模型，並透過微調獲得特定場景能力。在這個過程中，他們或許確實會使用其他大型模型來合成數據，使小模型獲得對應的能力。」李表示，這是所有大模型訓練的範式，不僅限於小模型。

MiniMax 將訓練工作負載轉向國產晶片

李大海透露：「今年以來，隨著整個產業已將推論轉向國產晶片，我們也在逐步把訓練工作轉到國產晶片和國產集群。」他指出提升國產算力生態的兩條並行路徑：第一是由下而上逐步打磨，也就是大模型公司通過自身訓練實踐逐步完善生態，「就像一點一點把石板鑽透，這需要時間。」第二條是自上而下的規劃，以 MiniMax 與致遠研究院在 FlagOS 軟體生態上的深度合作為例。在該路徑下，大模型公司與晶片公司建立深度合作，在規劃下推進。MiniMax Intelligence AIInfra 負責人李昱軒指出，推論實際上比訓練需要更高精度，而 MiniMax 提出的模型規模擴展技術成為關鍵突破：能夠用非常小的模型來預測大型模型，並在國產晶片上進行深入評估，將實驗細節對齊海外製造商，且確認訓練精度是可用的。MiniMax 透露，它已在華為平台上完成了極低位元寬度的量化感知訓練，效率達到一般訓練的 95%。李大海解釋，損失的 5% 來自量化器本身的開銷，透過與華為的深度合作，該開銷已被最佳化到最小。

MiniCPM-5 1B 在 ArtificialAnalysis 基準上達近 GPT-4o 表現

MiniMax Intelligence 宣布，MiniCPM 小砲手第五代 1B 版本在權威 ArtificialAnalysis（AA）評測中取得 17.9 分。開源社群研究者進行對比後發現，於 2024 年 5 月發布的 GPT-4o（200B 參數）在同類型評測中得分為 18.3-18.6，兩者之間僅相差 0.4-0.7 分。李大海表示：「在 2024 年我們預測，到 2026 年底，邊緣模型的智慧水平可達到 GPT-4 等級。從目前數據來看，這個目標已提前達成。」

在先前的「MiniMax 開源週」期間，MiniMax Intelligence 發布了兩款邊緣端大模型：MiniCPM5-1B 與 BitCPM-CANN。MiniCPM5-1B 再次刷新了模型智慧密度的上限：在僅 1B 參數規模的情況下，它在國際知名的 AA-Index 排行榜上超越了所有低於 2B 參數的模型；相較於 3 個月前發布的 Qwen3.5-2B，MiniCPM5-1B 不僅表現更好，也把參數量減少了一半。

ForgeTrain AI 編寫的框架，訓練速度比 NVIDIA Megatron 快 10%

MiniCPM5-1B 模型由 MiniMax Intelligence 自行研發的 AI 訓練框架 ForgeTrain 進行預訓練，ForgeTrain 是全球首個完全由 AI 編寫、達到量產級的大模型預訓練框架，且不需要人工程式設計師參與。訓練速度比 NVIDIA Megatron 快 10%。

常見問題（FAQ）

李大海在 2026 北京致遠會議上談到代理技術限制時說了什麼？

李大海表示，公眾對零錯誤代理的期待超出了目前技術發展曲線所能交付的範圍，且該技術仍需時間成熟。他將目前的代理限制描述為「到處都是問題」，但同時強調錯誤率正在快速下降 — 在部分情況下，1 個月內可從 10% 降至 1%。

MiniCPM-5 1B 在 ArtificialAnalysis 基準上的表現如何與 GPT-4o 比較？

MiniCPM-5 1B（含 1B 參數）在 ArtificialAnalysis 評測中得分 17.9；而 GPT-4o（含 200B 參數，於 2024 年 5 月發布）在同一評測中得分 18.3-18.6，兩者之間的差距僅為 0.4-0.7 分。

ForgeTrain 是什麼，與 NVIDIA Megatron 相比如何？

ForgeTrain 是 MiniMax Intelligence 自行研發的 AI 訓練框架，是全球首個完全由 AI 編寫、且無需人工程式設計師參與的量產級大模型預訓練框架。它的訓練速度比 NVIDIA Megatron 快 10%。

View Source

免責聲明：本頁面資訊可能來自第三方來源，僅供參考，不代表 Gate 的立場或觀點，亦不構成任何財務、投資或法律建議。虛擬資產交易具有高風險，請勿僅依賴本頁資訊作出決策。詳情請參閱免責聲明。