O Google Gemini 3,5 melhora a tradução, chega ao fim das pausas na interpretação em tempo real em 70 línguas

2026-06-10 03:13:48

O Google anunciou a disponibilização do Gemini 3.5 Live Translate no dia 9 de junho, no blogue oficial, como o modelo de áudio mais recente da Gemini Live API. O objetivo é eliminar as pausas na conversa geradas no contexto da tradução de voz em tempo real, devido à necessidade de esperar pelo fim da frase completa. O Gemini 3.5 Live Translate deteta automaticamente mais de 70 línguas e utiliza geração contínua para emitir as traduções.

Características técnicas confirmadas do Gemini 3.5 Live Translate

Mecanismo de tradução: O Gemini 3.5 Live Translate adota uma abordagem “voz-a-voz”. Ajusta em tempo real, de forma dinâmica, entre “aguardar mais contexto para melhorar a exatidão” e “emitir imediatamente para acompanhar o interlocutor”. No conjunto, a diferença de tradução é de vários segundos.

Preservação das caraterísticas de voz: A saída de tradução mantém a entoação (intonation), o ritmo (pacing) e a altura da voz (pitch) do falante, em vez de ser apresentada como uma voz de máquina uniforme.

Diferenças face à geração anterior (confirmadas pelo Google): Anteriormente, os sistemas de tradução por voz tinham de aguardar até o interlocutor concluir uma frase completa antes de começarem a traduzir, o que provocava interrupções na conversa. O Gemini 3.5 Live Translate substitui esse mecanismo de espera por geração contínua.

Três canais confirmados com lançamento no mesmo dia

Pré-visualização pública para programadores: A Gemini Live API e o Google AI Studio ficam disponíveis a partir de 9 de junho de 2026.

Pré-visualização privada para empresas: O Google Meet para empresas inicia pré-visualização privada a partir de junho de 2026.

Atualização global para consumidores: A app Google Tradutor para Android e iOS foi igualmente atualizada. No Android é ainda adicionado o “modo de escuta”: quando o utilizador encosta o telemóvel ao ouvido, a voz traduzida é reproduzida pelo recetor de ouvido, sem necessidade de auscultadores e sem interferir com o ambiente envolvente. O Google apresenta como exemplos de cenários em que se aplica, incluindo guiamentos no exterior de museus em língua estrangeira ou atender chamadas telefónicas em língua estrangeira em ambientes silenciosos.

Cenário competitivo confirmado no mercado e parceiros

Produtos concorrentes equivalentes (já disponíveis): Meta SeamlessM4T, tradução de chamadas em tempo real do Samsung Galaxy AI, Apple Live Translation, OpenAI Realtime API.

Teste de integração da Grab (confirmado): A plataforma de chamadas de veículos da Ásia-Pacífico/SE-Asia, a Grab, está a testar a implementação do Gemini 3.5 Live Translate para permitir a comunicação multilingue em tempo real entre motoristas e passageiros. Os utilizadores da Grab efetuam mais de 10 milhões de chamadas de voz por mês através da sua plataforma. As línguas abrangem tâmil? wait no—(keep) includes thai, Vietnamese, Malay, Indonesian and Filipino.

Feedback de parceiros de fase inicial (confirmado): A CJ ENM e a LiveKit indicam que a qualidade da tradução, a exatidão e a latência estão dentro das expectativas.

Perguntas frequentes

Quais são as principais diferenças entre o Gemini 3.5 Live Translate e a funcionalidade anterior de voz do Google Tradutor?

Conforme a explicação oficial do Google, a principal diferença está na alteração do momento em que ocorre a tradução. Antes, a tradução por voz tinha de aguardar até o interlocutor concluir uma frase completa antes de começar a traduzir, causando interrupções na conversa. O Gemini 3.5 Live Translate utiliza geração contínua, reduzindo a diferença geral para alguns segundos, ao mesmo tempo que mantém a entoação, o ritmo e a altura da voz do falante.

Como se utiliza o “modo de escuta” no Android e em que cenários se aplica?

O “modo de escuta” é uma nova funcionalidade na app Google Tradutor para Android. Quando o utilizador encosta o telemóvel ao ouvido, a voz traduzida é reproduzida através do recetor de ouvido, sem necessidade de auscultadores Bluetooth e sem fazer com que influencie o ambiente envolvente através de altifalantes externos. O Google lista como cenários de aplicação, incluindo guiamentos em língua estrangeira num museu e atender chamadas em língua estrangeira em ambientes silenciosos.

Como obter atualmente o Gemini 3.5 Live Translate?

A partir de 9 de junho de 2026, o Gemini 3.5 Live Translate é disponibilizado através de três canais: pré-visualização pública para programadores da Gemini Live API e do Google AI Studio; pré-visualização privada para empresas do Google Meet (arranca este mês); e atualização global da app Google Tradutor para Android e iOS.

Aviso legal: As informações contidas nesta página podem provir de fontes externas e têm caráter meramente informativo. Não refletem os pontos de vista nem as opiniões da Gate e não constituem qualquer tipo de aconselhamento financeiro, de investimento ou jurídico. A negociação de ativos virtuais envolve um risco elevado. Não se baseie exclusivamente nas informações contidas nesta página ao tomar decisões. Para mais detalhes, consulte o Aviso legal.

Notícias relacionadas

13h atrás

A Google lança a tradução em tempo real de voz para voz com o Gemini 3.5 a 9 de junho

15h atrás

A Apple confirma que a IA do Siri é executada em servidores da Google no WWDC, mantendo as alegações de privacidade

20h atrás

A Samsung apresenta o Google Gemini e o ChatGPT da OpenAI em afiliadas este mês

A Google anuncia a tradução em tempo real do Gemini 3.5 para voz em mais de 70 línguas

Oliver Grant9h atrás

UE ordena à Meta que restabeleça o acesso à IA do WhatsApp no prazo de cinco dias

Oliver Grant9h atrás

A Apple confirma que a IA do Siri é executada em servidores da Google, mantendo as alegações de privacidade

Oliver Grant15h atrás

Apple WWDC 2026: Siri ganha uma atualização de IA em parceria com a Google Gemini, e o iOS 27 chega com uma app independente

Market Whisper06-09 01:14

Comentar

0/400

Nenhum comentário