MiniMax Intelligence 執行長李大海在 2026 北京致遠會議上表示,儘管技術進展迅速,但代理(agent)技術仍需要採取審慎的方式。李在接受澎湃新聞及其他媒體採訪時解釋,公眾對「零錯誤代理」的期待超出了目前技術發展曲線所能交付的範圍,因為該技術仍需要時間成熟。他指出 2025 年是代理的第一年,預期將出現爆炸式成長,並深刻影響人類社會;不過,他強調仍需對當前 AI 代理領域的技術能力做冷靜評估。
李大海闡述代理技術限制與快速演進
李大海承認,大模型與代理技術的融合正在快速演進,部分情境已落地於實際應用。談及代理限制時,李直言不諱:「到處都是問題。」他進一步說明:「模型與代理技術的演進非常快」,並指出:「或許今天某些工作有 10% 的錯誤率,下個月錯誤率下降到 1% — 快速演進已成為核心趨勢。」
MiniMax 執行長反駁小模型蒸餾誤解
李大海直面業界普遍認為「做出優秀的小模型必須來自對超大規模基礎模型的蒸餾」這一觀點,稱其為「認知誤解」。他解釋:「蒸餾背後有一個非常具體的前提:被蒸餾的對象本身必須是一個好模型。蒸餾本質上是:對於那些自身沒有能力開發基礎模型,但又想做應用落地的公司,他們會採用既有的小規模基礎模型,並透過微調獲得特定場景能力。在這個過程中,他們或許確實會使用其他大型模型來合成數據,使小模型獲得對應的能力。」李表示,這是所有大模型訓練的範式,不僅限於小模型。
MiniMax 將訓練工作負載轉向國產晶片
李大海透露:「今年以來,隨著整個產業已將推論轉向國產晶片,我們也在逐步把訓練工作轉到國產晶片和國產集群。」他指出提升國產算力生態的兩條並行路徑:第一是由下而上逐步打磨,也就是大模型公司通過自身訓練實踐逐步完善生態,「就像一點一點把石板鑽透,這需要時間。」第二條是自上而下的規劃,以 MiniMax 與致遠研究院在 FlagOS 軟體生態上的深度合作為例。在該路徑下,大模型公司與晶片公司建立深度合作,在規劃下推進。MiniMax Intelligence AIInfra 負責人李昱軒指出,推論實際上比訓練需要更高精度,而 MiniMax 提出的模型規模擴展技術成為關鍵突破:能夠用非常小的模型來預測大型模型,並在國產晶片上進行深入評估,將實驗細節對齊海外製造商,且確認訓練精度是可用的。MiniMax 透露,它已在華為平台上完成了極低位元寬度的量化感知訓練,效率達到一般訓練的 95%。李大海解釋,損失的 5% 來自量化器本身的開銷,透過與華為的深度合作,該開銷已被最佳化到最小。
MiniCPM-5 1B 在 ArtificialAnalysis 基準上達近 GPT-4o 表現
MiniMax Intelligence 宣布,MiniCPM 小砲手第五代 1B 版本在權威 ArtificialAnalysis(AA)評測中取得 17.9 分。開源社群研究者進行對比後發現,於 2024 年 5 月發布的 GPT-4o(200B 參數)在同類型評測中得分為 18.3-18.6,兩者之間僅相差 0.4-0.7 分。李大海表示:「在 2024 年我們預測,到 2026 年底,邊緣模型的智慧水平可達到 GPT-4 等級。從目前數據來看,這個目標已提前達成。」
在先前的「MiniMax 開源週」期間,MiniMax Intelligence 發布了兩款邊緣端大模型:MiniCPM5-1B 與 BitCPM-CANN。MiniCPM5-1B 再次刷新了模型智慧密度的上限:在僅 1B 參數規模的情況下,它在國際知名的 AA-Index 排行榜上超越了所有低於 2B 參數的模型;相較於 3 個月前發布的 Qwen3.5-2B,MiniCPM5-1B 不僅表現更好,也把參數量減少了一半。
ForgeTrain AI 編寫的框架,訓練速度比 NVIDIA Megatron 快 10%
MiniCPM5-1B 模型由 MiniMax Intelligence 自行研發的 AI 訓練框架 ForgeTrain 進行預訓練,ForgeTrain 是全球首個完全由 AI 編寫、達到量產級的大模型預訓練框架,且不需要人工程式設計師參與。訓練速度比 NVIDIA Megatron 快 10%。
常見問題(FAQ)
李大海在 2026 北京致遠會議上談到代理技術限制時說了什麼?
李大海表示,公眾對零錯誤代理的期待超出了目前技術發展曲線所能交付的範圍,且該技術仍需時間成熟。他將目前的代理限制描述為「到處都是問題」,但同時強調錯誤率正在快速下降 — 在部分情況下,1 個月內可從 10% 降至 1%。
MiniCPM-5 1B 在 ArtificialAnalysis 基準上的表現如何與 GPT-4o 比較?
MiniCPM-5 1B(含 1B 參數)在 ArtificialAnalysis 評測中得分 17.9;而 GPT-4o(含 200B 參數,於 2024 年 5 月發布)在同一評測中得分 18.3-18.6,兩者之間的差距僅為 0.4-0.7 分。
ForgeTrain 是什麼,與 NVIDIA Megatron 相比如何?
ForgeTrain 是 MiniMax Intelligence 自行研發的 AI 訓練框架,是全球首個完全由 AI 編寫、且無需人工程式設計師參與的量產級大模型預訓練框架。它的訓練速度比 NVIDIA Megatron 快 10%。