MiniMax Rilis Laporan Teknis M2; Sistem Forge Capai Peningkatan Kecepatan Pelatihan 40x

Menurut Beating, MiniMax merilis laporan teknis M2 di arXiv, yang merinci arsitektur unggulannya MoE (mixture-of-experts) serta sistem pelatihan Agen bernama Forge. Perusahaan mengungkapkan bagaimana Forge mengoptimalkan reinforcement learning Agen ber-konteks panjang melalui teknik windowed FIFO scheduling dan penggabungan prefix-tree, sehingga mencapai peningkatan kecepatan pelatihan hingga 40x.

M2.7 menunjukkan kemampuan evolusi mandiri agen, dengan menyelesaikan lebih dari 100 putaran analisis, revisi kode, dan siklus pengujian. Pada tolok ukur kinerja, M2.7 mencapai 56,22% di SWE-Pro dan 52,7% di Multi-SWE-bench, dengan tingkat reward rata-rata 66,6% pada MLE Bench, mendekati level kinerja Gemini 3.1.

Penafian: Informasi di halaman ini mungkin berasal dari sumber pihak ketiga dan hanya untuk referensi. Ini tidak mewakili pandangan atau pendapat Gate dan bukan merupakan nasihat keuangan, investasi, atau hukum. Perdagangan aset virtual melibatkan risiko tinggi. Mohon jangan hanya mengandalkan informasi di halaman ini saat membuat keputusan. Untuk detailnya, lihat Penafian.
Komentar
0/400
Tidak ada komentar