
Google a annoncé le lancement de Gemini 3.5 Live Translate le 9 juin dans son blog officiel. Il s’agit du dernier modèle audio de Gemini Live API, dont l’objectif est d’éliminer les pauses dans la conversation lors de la traduction vocale en temps réel, causées par l’attente de la fin de la phrase. Gemini 3.5 Live Translate détecte automatiquement plus de 70 langues et produit les traductions via une génération continue.
Caractéristiques techniques confirmées de Gemini 3.5 Live Translate
Mécanisme de traduction : Gemini 3.5 Live Translate utilise une approche « voix à voix » : il ajuste en temps réel sa génération entre « l’attente de davantage de contexte pour améliorer la précision » et « une sortie immédiate pour suivre l’interlocuteur ». L’écart global de traduction est de quelques secondes.
Préservation des caractéristiques vocales : la sortie traduite conserve l’intonation (intonation), le rythme (pacing) et la hauteur de la voix (pitch) du locuteur, plutôt que de la présenter sous forme de voix machine uniforme.
Différences avec les versions précédentes (confirmées par Google) : auparavant, les systèmes de traduction vocale devaient attendre que le locuteur ait terminé une phrase complète avant de commencer la traduction, ce qui entraînait une interruption de la conversation ; Gemini 3.5 Live Translate remplace ce mécanisme d’attente par une génération continue.
Trois canaux de déploiement confirmés le même jour
Aperçu public pour développeurs : Gemini Live API et Google AI Studio, disponibles à partir du 9 juin 2026.
Aperçu privé pour entreprises : Google Meet, version entreprise, lancement de l’aperçu privé à partir de juin 2026.
Mise à jour mondiale pour les consommateurs : l’application Google Traduction pour Android et iOS a été mise à jour en parallèle ; Android ajoute également le mode « Écoute », qui lit la voix traduite depuis l’écouteur lorsque l’utilisateur rapproche le téléphone de son oreille, sans casque et sans perturber l’environnement. Google cite notamment des scénarios comme des visites en langue étrangère à l’extérieur des musées ou la réception d’appels en langue étrangère dans des lieux calmes.
Situation concurrentielle et partenaires confirmés sur le marché
Produits concurrents similaires (déjà lancés) : Meta SeamlessM4T, traduction d’appels en temps réel Galaxy AI de Samsung, Apple Live Translation, OpenAI Realtime API.
Test d’intégration de Grab (confirmé) : la plateforme de réservation de courses Grab d’Asie du Sud-Est teste la mise en œuvre de Gemini 3.5 Live Translate pour permettre une communication multilingue instantanée entre chauffeurs et passagers. Les utilisateurs de Grab passent plus de 10 000 000 d’appels vocaux mensuels via sa plateforme ; les langues incluent le thaï, le vietnamien, le malais, l’indonésien et le philippin.
Retour des partenaires initiaux (confirmé) : CJ ENM et LiveKit indiquent que la qualité de la traduction, la précision et la latence ont atteint les objectifs attendus.
Questions fréquentes
Quelle est la principale différence entre Gemini 3.5 Live Translate et la fonctionnalité vocale de traduction précédente de Google ?
D’après les explications officielles de Google, la différence principale réside dans le moment où la traduction est effectuée. Auparavant, la traduction vocale devait attendre que l’interlocuteur ait terminé une phrase complète avant de commencer, ce qui interrompait la conversation ; Gemini 3.5 Live Translate utilise une génération continue, ce qui réduit l’écart global à quelques secondes, tout en conservant l’intonation, le rythme et la hauteur de la voix de l’interlocuteur.
Comment utiliser le mode « Écoute » sur Android, et dans quels cas est-il applicable ?
Le « mode Écoute » est une nouvelle fonctionnalité de la version Android de Google Traduction. Lorsque l’utilisateur rapproche le téléphone de son oreille, la voix traduite est diffusée depuis l’écouteur, sans nécessiter de casque Bluetooth, et sans affecter l’environnement via un haut-parleur externe. Google cite comme scénarios d’application les visites en langue étrangère dans les musées et la réception d’appels en langue étrangère dans des lieux calmes.
Comment obtenir Gemini 3.5 Live Translate actuellement ?
À la date du 9 juin 2026, Gemini 3.5 Live Translate est disponible via trois canaux : l’aperçu public pour développeurs de Gemini Live API et Google AI Studio ; l’aperçu privé pour entreprises de Google Meet (lancement ce mois-ci) ; et la mise à jour mondiale de l’application Google Traduction pour Android et iOS.