
O Google anunciou a disponibilização do Gemini 3.5 Live Translate no dia 9 de junho, no blogue oficial, como o modelo de áudio mais recente da Gemini Live API. O objetivo é eliminar as pausas na conversa geradas no contexto da tradução de voz em tempo real, devido à necessidade de esperar pelo fim da frase completa. O Gemini 3.5 Live Translate deteta automaticamente mais de 70 línguas e utiliza geração contínua para emitir as traduções.
Características técnicas confirmadas do Gemini 3.5 Live Translate
Mecanismo de tradução: O Gemini 3.5 Live Translate adota uma abordagem “voz-a-voz”. Ajusta em tempo real, de forma dinâmica, entre “aguardar mais contexto para melhorar a exatidão” e “emitir imediatamente para acompanhar o interlocutor”. No conjunto, a diferença de tradução é de vários segundos.
Preservação das caraterísticas de voz: A saída de tradução mantém a entoação (intonation), o ritmo (pacing) e a altura da voz (pitch) do falante, em vez de ser apresentada como uma voz de máquina uniforme.
Diferenças face à geração anterior (confirmadas pelo Google): Anteriormente, os sistemas de tradução por voz tinham de aguardar até o interlocutor concluir uma frase completa antes de começarem a traduzir, o que provocava interrupções na conversa. O Gemini 3.5 Live Translate substitui esse mecanismo de espera por geração contínua.
Três canais confirmados com lançamento no mesmo dia
Pré-visualização pública para programadores: A Gemini Live API e o Google AI Studio ficam disponíveis a partir de 9 de junho de 2026.
Pré-visualização privada para empresas: O Google Meet para empresas inicia pré-visualização privada a partir de junho de 2026.
Atualização global para consumidores: A app Google Tradutor para Android e iOS foi igualmente atualizada. No Android é ainda adicionado o “modo de escuta”: quando o utilizador encosta o telemóvel ao ouvido, a voz traduzida é reproduzida pelo recetor de ouvido, sem necessidade de auscultadores e sem interferir com o ambiente envolvente. O Google apresenta como exemplos de cenários em que se aplica, incluindo guiamentos no exterior de museus em língua estrangeira ou atender chamadas telefónicas em língua estrangeira em ambientes silenciosos.
Cenário competitivo confirmado no mercado e parceiros
Produtos concorrentes equivalentes (já disponíveis): Meta SeamlessM4T, tradução de chamadas em tempo real do Samsung Galaxy AI, Apple Live Translation, OpenAI Realtime API.
Teste de integração da Grab (confirmado): A plataforma de chamadas de veículos da Ásia-Pacífico/SE-Asia, a Grab, está a testar a implementação do Gemini 3.5 Live Translate para permitir a comunicação multilingue em tempo real entre motoristas e passageiros. Os utilizadores da Grab efetuam mais de 10 milhões de chamadas de voz por mês através da sua plataforma. As línguas abrangem tâmil? wait no—(keep) includes thai, Vietnamese, Malay, Indonesian and Filipino.
Feedback de parceiros de fase inicial (confirmado): A CJ ENM e a LiveKit indicam que a qualidade da tradução, a exatidão e a latência estão dentro das expectativas.
Perguntas frequentes
Quais são as principais diferenças entre o Gemini 3.5 Live Translate e a funcionalidade anterior de voz do Google Tradutor?
Conforme a explicação oficial do Google, a principal diferença está na alteração do momento em que ocorre a tradução. Antes, a tradução por voz tinha de aguardar até o interlocutor concluir uma frase completa antes de começar a traduzir, causando interrupções na conversa. O Gemini 3.5 Live Translate utiliza geração contínua, reduzindo a diferença geral para alguns segundos, ao mesmo tempo que mantém a entoação, o ritmo e a altura da voz do falante.
Como se utiliza o “modo de escuta” no Android e em que cenários se aplica?
O “modo de escuta” é uma nova funcionalidade na app Google Tradutor para Android. Quando o utilizador encosta o telemóvel ao ouvido, a voz traduzida é reproduzida através do recetor de ouvido, sem necessidade de auscultadores Bluetooth e sem fazer com que influencie o ambiente envolvente através de altifalantes externos. O Google lista como cenários de aplicação, incluindo guiamentos em língua estrangeira num museu e atender chamadas em língua estrangeira em ambientes silenciosos.
Como obter atualmente o Gemini 3.5 Live Translate?
A partir de 9 de junho de 2026, o Gemini 3.5 Live Translate é disponibilizado através de três canais: pré-visualização pública para programadores da Gemini Live API e do Google AI Studio; pré-visualização privada para empresas do Google Meet (arranca este mês); e atualização global da app Google Tradutor para Android e iOS.