
9 июня Google в официальном блоге объявила о запуске Gemini 3.5 Live Translate — это самый новый аудиомодель для Gemini Live API. Цель — устранить паузы в диалогах, возникающие в переводе речи в реальном времени из‑за ожидания завершения целой фразы. Gemini 3.5 Live Translate автоматически обнаруживает более 70 языков и выводит перевод в режиме непрерывной генерации.
Подтверждённые технические характеристики Gemini 3.5 Live Translate
Механизм перевода: Gemini 3.5 Live Translate использует подход «речь‑к‑речи». Модель в реальном времени динамически переключается между режимами «ожидание большего контекста для повышения точности» и «немедленный вывод, чтобы идти в ногу с говорящим», а общий разрыв составляет несколько секунд.
Сохранение речевых особенностей: в переводе сохраняются интонация (intonation), темп (pacing) и высота голоса (pitch) говорящего, а не выдаётся единый машинный голос.
Отличия от предшественников (подтверждено Google): ранее системы голосового перевода должны были ждать, пока говорящий произнесёт полностью законченную фразу, прежде чем начать перевод, что приводило к прерыванию диалога; Gemini 3.5 Live Translate заменяет этот механизм на режим непрерывной генерации.
Три подтверждённых канала запуска в тот же день
Открытый разработчикам предпросмотр: Gemini Live API и Google AI Studio — с 9 июня 2026 года.
Частный предпросмотр для компаний: Google Meet для бизнеса — с июня 2026 года.
Глобальное обновление для пользователей: приложение Google «Переводчик» для Android и iOS обновлено синхронно; на Android дополнительно появится режим «Слушать»: когда пользователь подносит телефон к уху, переводимый голос проигрывается из динамика, без необходимости наушников и без влияния на окружающую обстановку. Google приводит примеры подходящих сценариев, включая внешние экскурсии на иностранном языке в музее или приём звонков на иностранном языке в тихих местах.
Подтверждённая конкурентная ситуация на рынке и партнёры
Похожие конкурентные продукты (уже в продаже): Meta SeamlessM4T, Samsung Galaxy AI — перевод во время звонков в реальном времени, Apple Live Translation, OpenAI Realtime API.
Интеграционное тестирование Grab (подтверждено): юго‑восточная платформа заказа такси Grab тестирует реализацию для Gemini 3.5 Live Translate, чтобы обеспечить водителю и пассажиру общение на нескольких языках в реальном времени; пользователи Grab ежемесячно совершают через её платформу более 10 млн голосовых звонков, языки включают тайский, вьетнамский, малайский, индонезийский и филиппинский.
Обратная связь от ранних партнёров (подтверждено): CJ ENM и LiveKit сообщают, что качество перевода, точность и задержка соответствуют ожиданиям.
Частые вопросы
В чём основная разница между Gemini 3.5 Live Translate и предыдущими голосовыми функциями Google «Переводчик»?
По разъяснениям Google, основное отличие — изменение момента начала перевода. Ранее голосовой перевод требовал дождаться, пока говорящий произнесёт фразу целиком, прежде чем система начнёт перевод, из‑за чего происходило прерывание диалога; Gemini 3.5 Live Translate использует режим непрерывной генерации, а общий разрыв сокращается до нескольких секунд, при этом сохраняются интонация, темп и высота голоса говорящего.
Как пользоваться Android‑режимом «Слушать» и в каких сценариях он подходит?
«Слушать» — новая функция в приложении Google «Переводчик» для Android: когда пользователь подносит телефон к уху, переводимый голос воспроизводится из динамика, без необходимости подключать Bluetooth‑гарнитуру, и без того, чтобы через внешний громкоговоритель мешать окружающей среде. Google перечисляет в качестве подходящих сценариев внешние экскурсии на иностранных языках в музее и звонки на иностранном языке в тихих местах.
Как получить Gemini 3.5 Live Translate сейчас?
По состоянию на 9 июня 2026 года Gemini 3.5 Live Translate доступен через три канала: открытый предпросмотр для разработчиков Gemini Live API и Google AI Studio; частный предпросмотр Google Meet для компаний (запуск в этом месяце); а также глобальное обновление приложения Google «Переводчик» для Android и iOS.