Google представила Gemini 3.5 Live Translate — аудиомодель для живого перевода речи почти в реальном времени. Она сможет распознавать больше 70 языков, озвучивать перевод голосом и сохранять интонацию, темп и высоту голоса человека.

google translate

Главная задача модели — сделать устный перевод ближе к обычному разговору. Старым системам часто нужно было ждать, пока человек закончит фразу, а потом выдавать перевод отдельным ответом. Gemini 3.5 Live Translate сможет слушать речь непрерывно и идти за говорящим с задержкой в несколько секунд, поэтому диалог будет меньше похож на обмен короткими фразами через переводчик.

Сначала модель появится в инструментах для разработчиков и компаний в виде API. Для бизнес-пользователей Google Meet компания запустит закрытый тест в июне, а обычные пользователи смогут попробовать перевод в приложении Google Translate на Android и iOS.

Источник: Google

guest
0 Комментарий
Популярные
Новые Старые
Межтекстовые Отзывы
Посмотреть все комментарии
Поделиться ВКонтакте Telegram