OpenAI y Broadcom presentan el chip de IA Jalapeno para inferencia de LLM el 25 de junio

Según OpenAI, la empresa y Broadcom presentaron Jalapeno el 25 de junio, un acelerador de IA personalizado diseñado específicamente para la inferencia de modelos de lenguaje de gran tamaño. Desarrollado en conjunto con Broadcom y Celestica, Jalapeno representa el primer componente de una plataforma informática planificada de múltiples generaciones destinada a mejorar la velocidad, eficiencia y accesibilidad de los sistemas avanzados de IA. El chip se construyó a partir de investigaciones internas sobre los requisitos de inferencia de LLM e incorpora optimización de kernels, manejo de memoria, redes y sistemas de servicio. Las muestras de ingeniería tempranas ya están ejecutando cargas de trabajo de aprendizaje automático en entornos de laboratorio, incluidas las asociadas con modelos avanzados como GPT-5.3-Codex-Spark, operando a los niveles de frecuencia y potencia objetivo. La arquitectura enfatiza la reducción del movimiento de datos y la distribución equilibrada de recursos entre cómputo, memoria y redes, diseñada para funcionar en diferentes modelos de lenguaje de gran tamaño.
Aviso legal: La información en esta página puede provenir de fuentes de terceros y es solo para referencia. No representa las opiniones ni puntos de vista de Gate y no constituye asesoramiento financiero, de inversión ni legal. El comercio de activos virtuales implica un alto riesgo. No te bases únicamente en la información presentada en esta página para tomar decisiones. Para más detalles, consulta el Aviso legal.
Comentar
0/400
Sin comentarios