Обновление перевода Google Gemini 3.5: остановка задержек в синхронном переводе на 70 языках в реальном времени

Google翻譯升級

9 июня Google в официальном блоге объявила о запуске Gemini 3.5 Live Translate — это самый новый аудиомодель для Gemini Live API. Цель — устранить паузы в диалогах, возникающие в переводе речи в реальном времени из‑за ожидания завершения целой фразы. Gemini 3.5 Live Translate автоматически обнаруживает более 70 языков и выводит перевод в режиме непрерывной генерации.

Подтверждённые технические характеристики Gemini 3.5 Live Translate

Механизм перевода: Gemini 3.5 Live Translate использует подход «речь‑к‑речи». Модель в реальном времени динамически переключается между режимами «ожидание большего контекста для повышения точности» и «немедленный вывод, чтобы идти в ногу с говорящим», а общий разрыв составляет несколько секунд.

Сохранение речевых особенностей: в переводе сохраняются интонация (intonation), темп (pacing) и высота голоса (pitch) говорящего, а не выдаётся единый машинный голос.

Отличия от предшественников (подтверждено Google): ранее системы голосового перевода должны были ждать, пока говорящий произнесёт полностью законченную фразу, прежде чем начать перевод, что приводило к прерыванию диалога; Gemini 3.5 Live Translate заменяет этот механизм на режим непрерывной генерации.

Три подтверждённых канала запуска в тот же день

Открытый разработчикам предпросмотр: Gemini Live API и Google AI Studio — с 9 июня 2026 года.

Частный предпросмотр для компаний: Google Meet для бизнеса — с июня 2026 года.

Глобальное обновление для пользователей: приложение Google «Переводчик» для Android и iOS обновлено синхронно; на Android дополнительно появится режим «Слушать»: когда пользователь подносит телефон к уху, переводимый голос проигрывается из динамика, без необходимости наушников и без влияния на окружающую обстановку. Google приводит примеры подходящих сценариев, включая внешние экскурсии на иностранном языке в музее или приём звонков на иностранном языке в тихих местах.

Подтверждённая конкурентная ситуация на рынке и партнёры

Похожие конкурентные продукты (уже в продаже): Meta SeamlessM4T, Samsung Galaxy AI — перевод во время звонков в реальном времени, Apple Live Translation, OpenAI Realtime API.

Интеграционное тестирование Grab (подтверждено): юго‑восточная платформа заказа такси Grab тестирует реализацию для Gemini 3.5 Live Translate, чтобы обеспечить водителю и пассажиру общение на нескольких языках в реальном времени; пользователи Grab ежемесячно совершают через её платформу более 10 млн голосовых звонков, языки включают тайский, вьетнамский, малайский, индонезийский и филиппинский.

Обратная связь от ранних партнёров (подтверждено): CJ ENM и LiveKit сообщают, что качество перевода, точность и задержка соответствуют ожиданиям.

Частые вопросы

В чём основная разница между Gemini 3.5 Live Translate и предыдущими голосовыми функциями Google «Переводчик»?

По разъяснениям Google, основное отличие — изменение момента начала перевода. Ранее голосовой перевод требовал дождаться, пока говорящий произнесёт фразу целиком, прежде чем система начнёт перевод, из‑за чего происходило прерывание диалога; Gemini 3.5 Live Translate использует режим непрерывной генерации, а общий разрыв сокращается до нескольких секунд, при этом сохраняются интонация, темп и высота голоса говорящего.

Как пользоваться Android‑режимом «Слушать» и в каких сценариях он подходит?

«Слушать» — новая функция в приложении Google «Переводчик» для Android: когда пользователь подносит телефон к уху, переводимый голос воспроизводится из динамика, без необходимости подключать Bluetooth‑гарнитуру, и без того, чтобы через внешний громкоговоритель мешать окружающей среде. Google перечисляет в качестве подходящих сценариев внешние экскурсии на иностранных языках в музее и звонки на иностранном языке в тихих местах.

Как получить Gemini 3.5 Live Translate сейчас?

По состоянию на 9 июня 2026 года Gemini 3.5 Live Translate доступен через три канала: открытый предпросмотр для разработчиков Gemini Live API и Google AI Studio; частный предпросмотр Google Meet для компаний (запуск в этом месяце); а также глобальное обновление приложения Google «Переводчик» для Android и iOS.

Дисклеймер: Информация на этой странице может быть получена из источников третьих сторон и предоставляется только для ознакомления. Она не отражает взгляды или мнения Gate и не является финансовой, инвестиционной или юридической рекомендацией. Торговля виртуальными активами связана с высоким риском. Пожалуйста, не основывайте свои решения исключительно на данных этой страницы. Подробнее смотрите в Дисклеймере.
комментарий
0/400
Нет комментариев