MiniMax 發布 M2 技術報告;Forge 系統實現 40 倍訓練加速

根據 Beating,MiniMax 已在 arXiv 發布其 M2 技術報告,詳細說明其旗艦型 MoE(mixture-of-experts,混合專家)架構與 Agent 訓練系統 Forge。該公司披露 Forge 如何透過分段的 FIFO(先進先出)排程以及前綴樹合併技術,優化長上下文的 Agent 強化學習,並達到最高 40 倍的訓練加速。

M2.7 展示了自主代理自我進化能力,完成超過 100 輪的分析、程式碼修訂與測試循環。在效能基準測試上,M2.7 在 SWE-Pro 上達到 56.22%,在 Multi-SWE-bench 上達到 52.7%,並在 MLE Bench 上取得 66.6% 的平均獎勵率,接近 Gemini 3.1 的效能水準。

免責聲明:本頁面資訊可能來自第三方來源,僅供參考,不代表 Gate 的立場或觀點,亦不構成任何財務、投資或法律建議。虛擬資產交易具有高風險,請勿僅依賴本頁資訊作出決策。詳情請參閱 免責聲明
回覆
0/400
暫無回覆