MiniMax lança o relatório técnico M2; o sistema Forge atinge um aumento de 40x na velocidade de treino

Segundo Beating, a MiniMax publicou o seu relatório técnico M2 no arXiv, detalhando a sua arquitetura MoE (mixture-of-experts) de referência e o sistema de treino de agentes Forge. A empresa revelou como o Forge otimiza a aprendizagem por reforço de Agents com longos contextos através de técnicas de escalonamento FIFO em janelas e de fusão por árvore de prefixos, alcançando até 40x de aceleração no treino.

O M2.7 demonstrou capacidades de auto-evolução de agentes autónomos, completando mais de 100 rondas de ciclos de análise, revisão de código e testes. Em benchmarks de desempenho, o M2.7 atingiu 56,22% no SWE-Pro e 52,7% no Multi-SWE-bench, com uma taxa média de recompensas de 66,6% no MLE Bench, aproximando-se dos níveis de desempenho do Gemini 3.1.

Aviso legal: As informações contidas nesta página podem provir de fontes externas e têm caráter meramente informativo. Não refletem os pontos de vista nem as opiniões da Gate e não constituem qualquer tipo de aconselhamento financeiro, de investimento ou jurídico. A negociação de ativos virtuais envolve um risco elevado. Não se baseie exclusivamente nas informações contidas nesta página ao tomar decisões. Para mais detalhes, consulte o Aviso legal.
Comentar
0/400
Nenhum comentário