A atualização de tradução do Google Gemini 3.5 chega, e a interrupção das pausas do fim da interpretação simultânea em 70 idiomas termina

Google翻譯升級

O Google anunciou em 9 de junho, no blog oficial, o lançamento do Gemini 3.5 Live Translate. Trata-se do modelo de áudio mais recente do Gemini Live API, com o objetivo de eliminar as pausas na conversa durante a tradução de voz em tempo real causadas pela espera do término de uma frase completa. O Gemini 3.5 Live Translate detecta automaticamente mais de 70 idiomas e gera as traduções continuamente.

Características técnicas já confirmadas do Gemini 3.5 Live Translate

Mecanismo de tradução: O Gemini 3.5 Live Translate usa um método de tradução “voz para voz”. Ele ajusta em tempo real, de forma dinâmica, entre “esperar mais contexto para melhorar a precisão” e “gerar imediatamente para acompanhar quem está falando”, e a diferença geral de tradução fica em alguns segundos.

Preservação de características de voz: A saída traduzida mantém a entonação (intonation), o ritmo (pacing) e a altura do som (pitch) do locutor, em vez de apresentar a fala como uma voz mecânica única.

Diferenças em relação à geração anterior (confirmado pelo Google): Antes, o sistema de tradução por voz precisava esperar o locutor terminar uma frase completa para começar a traduzir, o que causava interrupções no diálogo. O Gemini 3.5 Live Translate substitui esse mecanismo de espera por geração contínua.

Três canais confirmados com lançamento no mesmo dia

Prévia pública para desenvolvedores: Gemini Live API e Google AI Studio; disponíveis em 9 de junho de 2026.

Prévia privada para empresas: Google Meet para empresas; prévia privada a partir de junho de 2026.

Atualização global para consumidores: O app Google Tradutor para Android e iOS foi atualizado em conjunto; no Android, também foi adicionada a “Modo de escuta”, que reproduz a voz traduzida pelo alto-falante do telefone quando o usuário aproxima o celular da orelha — sem necessidade de fones de ouvido e sem afetar o ambiente ao redor. O Google cita cenários de uso, como visitas guiadas em idiomas estrangeiros fora de museus ou atender chamadas em idioma estrangeiro em ambientes silenciosos.

Cenário de concorrência e parceiros já confirmados

Produtos concorrentes do mesmo segmento (já lançados): Meta SeamlessM4T, tradução de chamadas em tempo real da Samsung Galaxy AI, Apple Live Translation, OpenAI Realtime API.

Teste de integração da Grab (confirmado): A plataforma de transporte por aplicativo da região Sudeste Asiático, Grab, está testando o Gemini 3.5 Live Translate para permitir comunicação multilíngue em tempo real entre motoristas e passageiros. Usuários da Grab fazem mais de 10 milhões de chamadas de voz por mês via sua plataforma; os idiomas incluem tailandês, vietnamita, malaio, indonésio e filipino.

Feedback de parceiros iniciais (confirmado): CJ ENM e LiveKit afirmaram que a qualidade da tradução, a precisão e a latência ficaram dentro do esperado.

Perguntas frequentes

Quais são as principais diferenças entre o Gemini 3.5 Live Translate e os recursos anteriores de tradução de voz do Google?

De acordo com a explicação do Google, a principal diferença está na mudança do momento da tradução. Antes, a tradução por voz precisava esperar o locutor terminar uma frase completa para começar a traduzir, o que causava interrupções na conversa; o Gemini 3.5 Live Translate usa geração contínua, reduzindo a diferença geral para alguns segundos, e ainda preserva a entonação, o ritmo e a altura do som do locutor.

Como o “Modo de escuta” do Android é usado e em quais cenários se aplica?

O “Modo de escuta” é um novo recurso do Google Tradutor para Android. Quando o usuário aproxima o celular da orelha, a voz traduzida é reproduzida no alto-falante, sem a necessidade de fones de ouvido Bluetooth e sem afetar o ambiente ao redor por meio de um alto-falante externo. O Google lista como cenários de uso visitas guiadas em idiomas estrangeiros em museus e atender chamadas em idioma estrangeiro em ambientes silenciosos.

Como obter o Gemini 3.5 Live Translate atualmente?

Em 9 de junho de 2026, o Gemini 3.5 Live Translate fica disponível por três canais: prévia pública para desenvolvedores do Gemini Live API e do Google AI Studio; prévia privada para empresas do Google Meet (iniciada neste mês); e a atualização global do app Google Tradutor para Android e iOS.

Isenção de responsabilidade: as informações nesta página podem ter origem em fontes terceiras e servem apenas como referência. Não representam as opiniões da Gate e não constituem orientação financeira, de investimentos ou jurídica. A negociação de ativos virtuais envolve alto risco. Não tome decisões baseando-se apenas nas informações desta página. Para mais detalhes, consulte a Isenção de responsabilidade.
Comentário
0/400
Sem comentários