La mejora de traducción de Google Gemini 3.5 termina con interrupciones en la interpretación simultánea en 70 idiomas en tiempo real

Google翻譯升級

Google anunció el 9 de junio, en su blog oficial, el lanzamiento de Gemini 3.5 Live Translate, el modelo de audio más reciente de la Gemini Live API. Su objetivo es eliminar las pausas en la conversación que se producen en la traducción de voz en tiempo real al esperar a que se complete una frase. Gemini 3.5 Live Translate detecta automáticamente más de 70 idiomas y genera las traducciones mediante un proceso de generación continua.

Características técnicas confirmadas de Gemini 3.5 Live Translate

Mecanismo de traducción: Gemini 3.5 Live Translate utiliza el método de traducción “voz a voz”, ajustando en tiempo real entre “esperar más contexto para mejorar la precisión” y “emitir de inmediato para seguir al interlocutor”. En conjunto, la diferencia de la traducción es de unos segundos.

Conservación de las características de voz: La salida de la traducción conserva la entonación (intonation), el ritmo (pacing) y el tono (pitch) del hablante, en lugar de presentarla con una voz mecánica uniforme.

Diferencias con respecto a las generaciones anteriores (confirmadas por Google): Antes, los sistemas de traducción de voz debían esperar a que el hablante terminara de decir la frase completa para iniciar la traducción, lo que provocaba interrupciones en la conversación; Gemini 3.5 Live Translate sustituye este mecanismo de espera por una generación continua.

Tres canales de lanzamiento confirmados para el mismo día

Vista previa pública para desarrolladores: Gemini Live API y Google AI Studio, a partir del 9 de junio de 2026.

Vista previa privada para empresas: Google Meet versión empresarial, con el inicio de la vista previa privada en junio de 2026.

Actualización global para consumidores: Las versiones de Android e iOS de la app Google Translate se actualizan de forma sincronizada; además, Android incorpora “modo de escucha”, que traduce las voces desde el auricular al acercar el teléfono a la oreja, sin necesidad de auriculares y sin afectar el entorno circundante. Google pone como ejemplos de escenarios aplicables las visitas guiadas en idiomas extranjeros en museos o responder llamadas en idiomas extranjeros en entornos silenciosos.

Panorama competitivo del mercado y socios confirmados

Productos competidores del mismo tipo (ya disponibles): Meta SeamlessM4T, traducción de llamadas en tiempo real de Samsung Galaxy AI, Apple Live Translation, OpenAI Realtime API.

Pruebas de integración de Grab (confirmadas): La plataforma de transporte bajo demanda de Sudeste Asiático, Grab, está probando la traducción multilingüe en tiempo real entre conductores y pasajeros mediante Gemini 3.5 Live Translate; los usuarios de Grab realizan más de 10 millones de llamadas de voz al mes a través de su plataforma. Los idiomas incluyen tailandés, vietnamita, malayo, indonesio y filipino.

Reacción de socios de colaboración iniciales (confirmadas): CJ ENM y LiveKit indicaron que la calidad de traducción, la precisión y la latencia cumplieron con lo esperado.

Preguntas frecuentes

¿Cuál es la principal diferencia entre Gemini 3.5 Live Translate y las funciones de voz de traducción de Google anteriores?

De acuerdo con la explicación oficial de Google, la diferencia principal es el cambio en el momento de la traducción. Antes, la traducción de voz necesitaba esperar a que el hablante dijera la frase completa para comenzar la traducción, lo que provocaba una interrupción en la conversación; Gemini 3.5 Live Translate utiliza una generación continua, reduciendo la brecha general a unos segundos y conservando la entonación, el ritmo y el tono del hablante.

¿Cómo se usa el “modo de escucha” en Android y en qué escenarios aplica?

El “modo de escucha” es una nueva función para Android de Google Translate. Cuando el usuario acerca el teléfono a la oreja, la voz traducida se reproduce desde el auricular, sin necesidad de emparejar auriculares Bluetooth y sin que pase a través de un altavoz externo ni afecte el entorno circundante. Google enumera como escenarios aplicables las visitas guiadas en idiomas extranjeros en museos y recibir llamadas en idiomas extranjeros en entornos silenciosos.

¿Cómo se obtiene actualmente Gemini 3.5 Live Translate?

A fecha del 9 de junio de 2026, Gemini 3.5 Live Translate se abre mediante tres canales: la vista previa pública para desarrolladores de Gemini Live API y de Google AI Studio; la vista previa privada para empresas de Google Meet (se inicia este mes); y la actualización global de la app Google Translate en Android e iOS.

Aviso legal: La información en esta página puede provenir de fuentes de terceros y es solo para referencia. No representa las opiniones ni puntos de vista de Gate y no constituye asesoramiento financiero, de inversión ni legal. El comercio de activos virtuales implica un alto riesgo. No te bases únicamente en la información presentada en esta página para tomar decisiones. Para más detalles, consulta el Aviso legal.
Comentar
0/400
Sin comentarios