De acuerdo con la monitorización de Beating.AI, una nueva opción de modelo llamada gemini-3.2-flash-lite-live-preview ha aparecido en la lista de selección de modelos de Google Cloud a partir del 17 de mayo. Los sufijos “lite” y “live” indican que Google está creando una versión especializada optimizada para interacciones en tiempo real de latencia ultra baja.
El CEO de Abacus.AI, Bindu Reddy, reveló previamente que Gemini 3.2 Flash logra el 92% de las capacidades de codificación y razonamiento de GPT-5.5, manteniendo los costos de inferencia en solo 1/20 de los de GPT-5.5, con la mayoría de las consultas devolviendo respuestas por debajo de 200 milisegundos. Los observadores de la industria esperan que este modelo ligero optimizado por costos sea presentado formalmente en Google I/O el 20 de mayo.
Related News
Los próximos grandes ganadores en cripto: las mejores monedas con potencial de 1000x
X publica el código fuente del algoritmo de recomendaciones «Para ti»: una guía práctica para operar cuentas de Twitter con el algoritmo
OpenAI agrega la detección de conversaciones de crisis de ChatGPT, mejorando la capacidad de alertas tempranas sobre violencia autoinfligida