Mensaje de Gate News, 24 de abril — la jefa del equipo de modelos de lenguaje de Xiaomi, Luo Fuli, reveló en una entrevista en profundidad que el modelo MiMo-V2-Pro cuenta con un total de 1 billón de parámetros y que requirió miles de GPUs para el entrenamiento. Señaló que la escala de 1T representa el umbral mínimo para lograr un rendimiento cercano al nivel de Claude Opus 4.6 y asegurar un pase de entrada competitivo para la siguiente fase de agentes de IA.
Técnicamente, la versión Pro emplea un mecanismo extremo de atención dispersa con una proporción 7:1 entre la atención global y la atención de ventana deslizante, controlando los costos de inferencia para el procesamiento de contextos largos. El modelo también conserva la arquitectura MTP (Multi-Token Prediction) para aprovechar el exceso de potencia de cómputo y lograr una inferencia más rápida.
En el aspecto de gestión, el equipo MiMo de 100 personas solo cuenta con 30-40 integrantes involucrados directamente en las iteraciones principales. El equipo opera sin jerarquías formales ni divisiones explícitas de subgrupos, y sin fechas límite de entrega. Cuando se encuentran problemas numéricos inestables como picos en la pérdida de entrenamiento, el equipo prioriza detener el entrenamiento para investigarlo, incluso si eso significa detener las operaciones durante una o dos semanas y asumir costos de cómputo de millones de dólares.
Aviso legal: La información de esta página puede proceder de terceros y no representa los puntos de vista ni las opiniones de Gate. El contenido que aparece en esta página es solo para fines informativos y no constituye ningún tipo de asesoramiento financiero, de inversión o legal. Gate no garantiza la exactitud ni la integridad de la información y no se hace responsable de ninguna pérdida derivada del uso de esta información. Las inversiones en activos virtuales conllevan riesgos elevados y están sujetas a una volatilidad significativa de los precios. Podrías perder todo el capital invertido. Asegúrate de entender completamente los riesgos asociados y toma decisiones prudentes de acuerdo con tu situación financiera y tu tolerancia al riesgo. Para obtener más información, consulta el
Aviso legal.
Artículos relacionados
Xpeng, Xiaomi Lead In-Car AI Push at Beijing Auto Show
Gate News message, April 24 — Chinese automakers showcased advanced in-car AI systems at the Beijing Auto Show on April 24, as the country accelerates its AI Plus strategy and seeks greater independence from foreign semiconductors.
Xpeng demonstrated voice-controlled parking that allows drivers to
GateNewsHace35m
Ex ingeniero de Seed de ByteDance: la iteración de la IA de ByteDance tarda seis meses frente a los tres meses de Google
Mensaje de Gate News, 24 de abril — Zhang Chi, ex ingeniero del equipo Seed de ByteDance y profesor asistente actual en la Universidad de Pekín, reveló en el podcast "Into Asia" que ByteDance requiere aproximadamente seis meses para completar un ciclo completo de entrenamiento de preentrenamiento de modelos de lenguaje a gran escala (pretraining
GateNewsHace51m
El ingeniero de OpenAI Clive Chan cuestiona las recomendaciones de hardware de V4, citando errores y falta de claridad frente a V3
Mensaje de Gate News, 24 de abril — El ingeniero de OpenAI, Clive Chan, ha presentado objeciones detalladas al capítulo de recomendaciones de hardware en el informe técnico V4, calificándolo de "sorprendentemente mediocre y propenso a errores" en comparación con la versión V3 aclamada. La guía de hardware de V3, que incluyó sesiones de Q&A
GateNewshace1h
Naver lanza la beta de AI Tab mientras Google Gemini entra en el mercado de búsquedas de Corea del Sur
Mensaje de Gate News, 24 de abril — Naver anunció el inicio de una beta cerrada para AI Tab, su nueva función de búsqueda conversacional, tras el lanzamiento de Gemini en Chrome por parte de Google en Corea del Sur.
AI Tab aparecerá junto a las pestañas de búsqueda existentes de Naver, ofreciendo a los usuarios un espacio dedicado para consultas conversacionales
GateNewshace1h
La contratación de ingeniería en IA en India se dispara un 59,5% y se expande más allá de los centros tecnológicos
El Informe sobre el Mercado Laboral de la IA de LinkedIn 2026, publicado el 24 de abril, descubrió que la contratación de ingeniería de IA en India aumentó un 59,5% interanual, marcando el ritmo más rápido entre los mercados estudiados por la plataforma.
El crecimiento estuvo impulsado por una expansión de la demanda más allá de los centros tecnológicos establecidos. Ciudades, incluidas
CryptoFrontierhace1h
Banco Commonwealth reduce 120 empleos en medio de la expansión de la IA
Commonwealth Bank of Australia anunció que recortará aproximadamente 120 empleos mientras el mayor banco del país revisa sus puestos y amplía el uso de inteligencia artificial, según Bloomberg. Los recortes incluyen 43 puestos en Bankwest en Australia Occidental, con seis posiciones afectadas por la automatización. Esto es
CryptoFrontierhace2h