OpenRouter: La brecha de IA entre China y EE.UU. es de solo 3 a 6 meses, los modelos de código abierto están arrasando el mundo.

OpenRouter señala a varios representantes: DeepSeek V4 Flash, que a un precio ultrabarato se abre paso en flujos agentivos reales; GLM 5.2, que ocupa el primer puesto en la evaluación de Artificial Analysis y toma el trono de la calidad; y Nvidia Nemotron 3 Ultra, que representa al equipo estadounidense completamente abierto.
(Preámbulo: ¿Cuenta regresiva para el fin de la era de precios altos en la IA? Cinco razones estructurales por las que los tokens inevitablemente bajarán de precio)
(Contexto adicional: ¡Anthropic bloquea por completo a China! Empresas con capital chino, tanto nacionales como en el extranjero, tienen prohibido usar Claude, levantando una barrera de seguridad nacional)

Índice

Toggle

  • DeepSeek lleva el precio al suelo
  • GLM toma el trono de la calidad
  • Equipo estadounidense: Nvidia Nemotron 3 Ultra

Hace dos años, el trono de los pesos abiertos pertenecía a Meta con Llama. Hoy, los datos de OpenRouter, el enrutador de LLM neutral más grande del mundo, muestran que Llama ha caído por completo del ranking. A mayo de 2026, los modelos de pesos abiertos de China ya consumen aproximadamente el 61% de los tokens en esa plataforma, solo DeepSeek representa el 17.6% en una semana.

Detrás de este cambio de panorama, hay un hecho subestimado: la inteligencia y capacidad de los modelos de pesos abiertos se mantienen estables detrás de los laboratorios punteros de EE. UU. por tres a seis meses, y esta brecha no se está ampliando. Para cualquier organización que analice sus facturas en la nube, trasladar cargas de trabajo desde modelos punteros a pesos abiertos significa ahorrar dinero real.

DeepSeek lleva el precio al suelo

DeepSeek V4 Flash es el primer modelo de pesos abiertos que el equipo lanzó directamente en flujos agentivos reales, usándolo como sustituto de modelos punteros como Anthropic u OpenAI. La versión más grande V4 Pro obtuvo un 80.6% en SWE-bench Verified, la puntuación más alta entre pesos abiertos (SWE-bench Verified, en términos simples, es un examen que evalúa si un modelo puede programar usando tareas reales de reparación de código de GitHub).

DeepSeek V4-Pro

  • Tarifa de entrada sin acierto de caché: 0.30 USD por millón de tokens
  • Tarifa de entrada con acierto de caché: 0.03 USD por millón de tokens
  • Tarifa de salida: 0.50 USD por millón de tokens

DeepSeek R1 (Experto en razonamiento profundo y pensamiento)

  • Tarifa de entrada sin acierto de caché: 0.55 USD por millón de tokens
  • Tarifa de entrada con acierto de caché: 0.14 USD por millón de tokens
  • Tarifa de salida: 2.19 USD por millón de tokens

DeepSeek V4-Flash (Opción de máxima velocidad y bajo costo)

  • Tarifa de entrada sin acierto de caché: 0.14 USD por millón de tokens
  • Tarifa de entrada con acierto de caché: 0.0028 USD por millón de tokens
  • Tarifa de salida: 0.28 USD por millón de tokens

Acierto de caché significa: cuando se repite la misma indicación o historial de conversación, la tarifa de entrada se reduce significativamente entre un 70% y un 90%.

GLM toma el trono de la calidad

El modelo abierto GLM 5.2, lanzado por z-ai a mediados de junio, fue clasificado como el primero en pesos abiertos por el Intelligence Index v4.1 de la agencia de evaluación independiente Artificial Analysis, con 51 puntos, superando los 48 de Nemotron 3 Ultra, los 44 de MiniMax M3 y DeepSeek V4 Pro, y solo unos 5 puntos por debajo del cerrado Claude Fable 5. En la evaluación agentiva más cercana a escenarios reales, GDPval-AA, está al mismo nivel que GPT-5.5.

Su fortaleza es la planificación. Para diseño de arquitectura, reestructuración de repositorios completos, y tareas agentivas de largo recorrido, GLM 5.2 es actualmente el sustituto portable más cercano al estilo Opus. El costo es que le gusta pensar: el precio real promedio ponderado en OpenRouter es de 0.447 USD por millón de tokens de entrada y 3.31 USD por millón de tokens de salida.

Lo más revelador es el momento. Unos días antes de la llegada de GLM 5.2, una orden de control de exportaciones de EE. UU. obligó a Anthropic a desactivar ampliamente Fable 5 y Mythos 5 para evitar el acceso de ciudadanos extranjeros. Por un lado, modelos cerrados que se cortan de repente por geopolítica; por el otro, pesos abiertos con licencia MIT, cercanos a la frontera, que cualquiera puede autoalojar.

Equipo estadounidense: Nvidia Nemotron 3 Ultra

Los pesos abiertos no solo provienen de China. Nvidia también lanzó recientemente Nemotron 3 Ultra, que obtuvo 48 puntos en el mismo ranking, siendo el mejor peso abierto de EE. UU., solo superado por GLM 5.2.

550 mil millones de parámetros, 55 mil millones activos, con arquitectura híbrida Mamba-2 y Transformer, bajo licencia OpenMDW; OpenMDW, en términos simples, no solo libera los pesos, sino que también abre el código de los datos de entrenamiento, la receta y las herramientas de evaluación. El cálculo de Nvidia es claro: cuanto más se usen modelos abiertos, más se venderán sus chips Blackwell, CUDA y servicios empresariales para ejecutar esos modelos.

Ver original
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios