Los costos de la GPU Nvidia Blackwell se duplican, pero el gasto de inferencia por token cae 35 veces frente a Hopper

Según el análisis más reciente del blog de Nvidia, las GPU Blackwell cuestan casi el doble por hora frente a la generación Hopper, pero ofrecen 35 veces menos costos de inferencia por token. Usando DeepSeek-R1 como modelo de prueba, Blackwell (GB300 NVL72) se alquila a 2,65 USD por GPU por hora frente a los 1,41 USD de Hopper, pero el rendimiento de un solo GPU pasa de 90 a 6.000 tokens por segundo. Este salto de rendimiento de 65x reduce los costos por millón de tokens de 4,20 USD a 0,12 USD.

La cifra de 0,12 USD asume optimización completa del software, incluida la inferencia de baja precisión FP4 y la predicción de múltiples tokens (MTP). Sin MTP habilitado, los costos por millón de tokens alcanzan aproximadamente 2,35 USD, bajando a 0,11 USD con él activo, lo que demuestra un impacto de optimización de 21x atribuible solo a esa función.

Aviso legal: La información de esta página puede proceder de terceros y no representa los puntos de vista ni las opiniones de Gate. El contenido que aparece en esta página es solo para fines informativos y no constituye ningún tipo de asesoramiento financiero, de inversión o legal. Gate no garantiza la exactitud ni la integridad de la información y no se hace responsable de ninguna pérdida derivada del uso de esta información. Las inversiones en activos virtuales conllevan riesgos elevados y están sujetas a una volatilidad significativa de los precios. Podrías perder todo el capital invertido. Asegúrate de entender completamente los riesgos asociados y toma decisiones prudentes de acuerdo con tu situación financiera y tu tolerancia al riesgo. Para obtener más información, consulta el Aviso legal.

Artículos relacionados

El CEO de Google DeepMind predice que la AGI llegará en 2030, dando a las empresas cuatro años para prepararse

Según la serie de videos de Sequoia Capital en la que aparece Demis Hassabis, el CEO de Google DeepMind predice que la inteligencia artificial general (AGI) llegará para 2030. Hassabis, ganador del Premio Nobel de Química de 2024, ve este calendario como una realidad empresarial estricta que obliga a los líderes a replantearse el diseño de producto de

GateNewsHace4m

OpenAI operará como una empresa con beneficios perpetuamente bajos y firma un acuerdo de suministro eléctrico de 20 años

Según Odaily, el CEO de OpenAI, Sam Altman, afirmó en Stripe Sessions que OpenAI busca convertirse en una empresa de infraestructura masiva y de rápido crecimiento, con beneficios persistentemente bajos, ofreciendo productos similares a un “medidor inteligente” que los usuarios pueden comprar para automatizar operaciones comerciales o integrarlos en

GateNewsHace5m

Forefront Tech completa la fijación de precios de la IPO $100M , para cotizar en Nasdaq

Según ChainCatcher, Forefront Tech Holdings Acquisition Corp completó una fijación de precio de una IPO de 100 millones de dólares el 30 de abril, que cotizará en Nasdaq bajo el ticker FTHAU. Los ingresos se utilizarán para explorar oportunidades de fusiones y adquisiciones en blockchain, inteligencia artificial, fintech y otros

GateNewsHace42m

Exejecutivo de Meta recauda fondos para la startup de IA Flourish con una valoración de 2,5 mil millones de dólares

Según Bloomberg, Thomas Reardon, exejecutivo de Meta que lideró el trabajo en Neural Band de Meta, está recaudando fondos para Flourish, una nueva startup de IA centrada en sistemas de IA de bajo consumo. Lux Capital y Google Ventures han acordado ser inversores principales, con patrocinadores que ya se han comprometido con 500 millones de dólares a una valoración de 2,5

GateNewsHace44m

OpenAI rastrea el problema del “Goblin” hasta una señal de recompensa por personalidad nerd, las menciones de “Goblin” se disparan un 175% en GPT-5.1

Según OpenAI, la empresa identificó la causa raíz del problema del «goblin» que afectó a los modelos GPT desde GPT-5.1 en adelante. Una señal de recompensa utilizada para reforzar el rasgo de personalidad «Nerdy» alentó resultados que incluían referencias a criaturas de fantasía, con el 76,2% del conjunto de datos de entrenamiento mostrando

GateNewshace1h
Comentar
0/400
Sin comentarios