A série MiMo-V2.5 da Xiaomi vai para o código aberto: 1T de parâmetros com eficiência de token superior vs GPT-5.4

Mensagem do Gate News, 27 de abril — A equipe MiMo da Xiaomi disponibilizou em código aberto a série de modelos de linguagem de grande porte MiMo-V2.5 sob licença MIT, com suporte a implantação comercial, treinamento contínuo e ajuste fino. Ambos os modelos apresentam uma janela de contexto de 1 milhão de tokens. O MiMo-V2.5-Pro é um modelo de especialistas mistos de texto puro (MoE) com 1,02 trilhão de parâmetros totais e 42 bilhões de parâmetros ativos, enquanto o MiMo-V2.5 é um modelo multimodal nativo com 310 bilhões de parâmetros totais e 15 bilhões de parâmetros ativos, com suporte à compreensão de texto, imagem, vídeo e áudio.

O MiMo-V2.5-Pro mira tarefas complexas de agentes e de programação. Nos benchmarks ClawEval, ele obteve 64% de Pass@3 consumindo aproximadamente 70.000 tokens por trajetória de tarefa — 40% a 60% menos tokens do que Claude Opus, Gemini 3.1 Pro e GPT-5.4. O modelo obteve 78,9 no SWE-bench Verified. Em uma demonstração, o V2.5-Pro implementou de forma independente um compilador completo de SysY para RISC-V para um projeto de curso do compilador da Universidade de Pequim em 4,3 horas, com 672 chamadas de ferramenta, alcançando uma pontuação perfeita de 233/233 em conjuntos de testes ocultos.

O MiMo-V2.5 foi projetado para cenários de agentes multimodais, equipado com um codificador de visão dedicado (729 milhões de parâmetros) e um codificador de áudio (261 milhões de parâmetros), com pontuação 62,3 no subconjunto geral Claw-Eval. Ambos os modelos empregam uma arquitetura híbrida que combina atenção por janela deslizante (SWA) e atenção global (GA), acompanhada por um módulo de predição de múltiplos tokens em 3 camadas (MTP) para inferência acelerada. Os pesos do modelo estão disponíveis no Hugging Face.

Junto ao lançamento de código aberto, a equipe MiMo lançou o “Orbit Quadrillion Token Creator Incentive Program”, oferecendo 100 quadrilhões de tokens gratuitos ao longo de 30 dias para usuários globais. Desenvolvedores individuais, equipes e empresas podem se inscrever via a página do programa, com um ciclo de avaliação de aproximadamente 3 dias úteis; os benefícios aprovados são distribuídos como Token Plans ou créditos diretos, compatíveis com ferramentas como Claude Code e Cursor.

Aviso: As informações nesta página podem ser provenientes de terceiros e não representam as opiniões ou pontos de vista da Gate. O conteúdo exibido nesta página é apenas para referência e não constitui aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou integridade das informações e não será responsável por quaisquer perdas decorrentes do uso dessas informações. Os investimentos em ativos virtuais apresentam altos riscos e estão sujeitos a uma volatilidade de preços significativa. Você pode perder todo o capital investido. Por favor, compreenda completamente os riscos envolvidos e tome decisões prudentes com base em sua própria situação financeira e tolerância ao risco. Para mais detalhes, consulte o Aviso Legal.

Related Articles

A ASML Aumenta a Produção de EUV em 36% com a Expansão da Demanda por Data Centers de IA

Fabricante holandês de equipamentos de chips ASML planeja aumentar a produção de máquinas de litografia extrema ultravioleta (EUV) em aproximadamente 36% em 2026, impulsionado por uma demanda crescente da expansão de data centers de IA, de acordo com a orientação mais recente da empresa. A ASML tem como objetivo fabricar pelo menos 60 sistemas padrão de EUV i

CryptoFrontier18m atrás

OpenAI perde metas de crescimento de usuários e vendas, levantando preocupações sobre gastos com infraestrutura de IA

Mensagem do Gate News, 28 de abril — De acordo com o The Wall Street Journal, a OpenAI não conseguiu cumprir suas metas internas de aquisição de novos usuários e crescimento das vendas, levando a preocupações dentro da empresa sobre sua capacidade de sustentar gastos massivos com

GateNews19m atrás

A Microsoft implanta o Copilot para 743.000 funcionários da Accenture

A Microsoft está lançando o Microsoft 365 Copilot para todos os 743.000 funcionários da Accenture, marcando sua maior implantação corporativa até o momento, segundo a Reuters. A medida amplia o plano da Accenture para 2024 de oferecer o Copilot a até 300.000 funcionários. Pesquisa da Accenture

CryptoFrontier1h atrás

DeepSeek Aumenta Capital Registrado em 50%, Participação do Fundador Liang Wenfeng Sobe para 34%

Mensagem do Gate News, 28 de abril — De acordo com dados do Qichacha, a DeepSeek (Hangzhou Deepseek AI Basic Technology Research Co., Ltd.) aumentou seu capital registrado de 10 milhões de iuanes para 15 milhões de iuanes. A contribuição do capital registrado do fundador Liang Wenfeng aumentou de 1 milhão de iuanes para 5,1 milhões de iuanes

GateNews1h atrás

Reservas da Meta de 1GW+ de Solar e Armazenamento de Energia para Data Centers de IA

A Meta assinou acordos de energia com a Overview Energy e a Noon Energy para garantir capacidade de energia para seus data centers de inteligência artificial, de acordo com o The Economic Times. A empresa reservou até 1 gigawatt

CryptoFrontier1h atrás

Zhipu Z.ai estende a promoção triplo de cotas do GLM Coding Plan até 30 de junho

Mensagem da Gate News, 28 de abril — A Zhipu Z.ai anunciou uma extensão da promoção triplo de cotas do seu GLM Coding Plan, originalmente com prazo até 30 de abril, para 30 de junho, abrangendo tanto os modelos GLM-5.1 quanto GLM-5-Turbo. A promoção está disponível no horário do Leste dos EUA, das 6:00 AM até 2:00 AM do dia seguinte. GLM Coding

GateNews1h atrás
Comentário
0/400
Sem comentários