Mensagem do Gate News, 24 de abril — A líder da equipe de modelos de linguagem da Xiaomi, Luo Fuli, revelou em uma entrevista aprofundada que o modelo MiMo-V2-Pro tem 1 trilhão de parâmetros no total e exigiu milhares de GPUs para o treinamento. Ela observou que a escala de 1T representa o limite mínimo para alcançar desempenho próximo ao nível Claude Opus 4.6 e garantir uma credencial competitiva para a próxima fase de agentes de IA.
Tecnicamente, a versão Pro utiliza um mecanismo de atenção esparsa extrema, com uma proporção de 7:1 entre atenção global e atenção por janela deslizante, controlando os custos de inferência para processamento de contexto longo. O modelo também mantém a arquitetura MTP (Multi-Token Prediction) para aproveitar o poder computacional excedente e permitir inferência mais rápida.
Do lado da gestão, a equipe MiMo de 100 pessoas tem apenas 30-40 pessoas diretamente envolvidas nas iterações centrais. A equipe opera sem hierarquias formais ou divisões explícitas de subgrupos, e sem prazos definidos de entrega. Ao se deparar com problemas numéricos instáveis, como picos na perda de treinamento, a equipe prioriza interromper o treinamento para investigação, mesmo que isso signifique parar as operações por uma ou duas semanas e incorrer em custos de computação que chegam a milhões de dólares.
Aviso: As informações nesta página podem ser provenientes de terceiros e não representam as opiniões ou pontos de vista da Gate. O conteúdo exibido nesta página é apenas para referência e não constitui aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou integridade das informações e não será responsável por quaisquer perdas decorrentes do uso dessas informações. Os investimentos em ativos virtuais apresentam altos riscos e estão sujeitos a uma volatilidade de preços significativa. Você pode perder todo o capital investido. Por favor, compreenda completamente os riscos envolvidos e tome decisões prudentes com base em sua própria situação financeira e tolerância ao risco. Para mais detalhes, consulte o
Aviso Legal.
Related Articles
Xpeng e Xiaomi lideram avanço de IA embarcada no Beijing Auto Show
Mensagem da Gate News, 24 de abril — Montadoras chinesas exibiram sistemas avançados de IA embarcada no Beijing Auto Show em 24 de abril, à medida que o país acelera sua estratégia AI Plus e busca maior independência de semicondutores estrangeiros.
A Xpeng demonstrou estacionamento controlado por voz que permite que os motoristas emitam comandos falados em vez de selecionar manualmente localizações.
GateNews34m atrás
Ex-engenheiro da Seed da ByteDance: A iteração de IA da ByteDance leva seis meses vs. os três meses do Google
Mensagem do Gate News, 24 de abril — Zhang Chi, ex-engenheiro da equipe Seed da ByteDance e atual professor assistente na Universidade de Pequim, revelou no podcast "Into Asia" que a ByteDance exige aproximadamente seis meses para concluir um ciclo completo de treinamento de pré-treinamento de modelo de linguagem grande (
GateNews51m atrás
Engenheiro da OpenAI Clive Chan questiona recomendações de hardware da V4, citando erros e falta de clareza em relação à V3
Mensagem do Gate News, 24 de abril — o engenheiro da OpenAI, Clive Chan, levantou objeções detalhadas ao capítulo de recomendações de hardware no relatório técnico V4, chamando-o de "surpreendentemente medíocre e propenso a erros" em comparação com a aclamada versão V3. A orientação de hardware da V3, que incluía sessões de Q&A
GateNews1h atrás
Naver lança beta do AI Tab à medida que o Google Gemini entra no mercado de buscas da Coreia do Sul
Mensagem do Gate News, 24 de abril — A Naver anunciou o início de um beta fechado para o AI Tab, seu novo recurso de busca conversacional, após o lançamento do Gemini pela Google no Chrome na Coreia do Sul.
O AI Tab aparecerá ao lado das abas de busca existentes da Naver, oferecendo aos usuários um espaço dedicado para consultas conversacionais
GateNews1h atrás
Contratação de Engenharia de IA na Índia dispara 59,5%, se expande além dos hubs de tecnologia
Relatório do Mercado de Trabalho de IA da LinkedIn 2026, divulgado em 24 de abril, descobriu que as contratações de engenharia de IA na Índia aumentaram 59,5% ano contra ano, marcando o ritmo mais rápido entre os mercados estudados pela plataforma.
O crescimento foi impulsionado pela demanda se expandindo além dos centros tecnológicos estabelecidos. Cidades incluindo
CryptoFrontier1h atrás
Banco Commonwealth Reduz 120 Empregos Com a Expansão da IA
O Commonwealth Bank of Australia anunciou que vai cortar aproximadamente 120 empregos enquanto o maior banco do país revisa funções e amplia o uso de inteligência artificial, de acordo com a Bloomberg. Os cortes incluem 43 funções no Bankwest, na Austrália Ocidental, com seis cargos afetados pela automação. Isto é
CryptoFrontier2h atrás