Переозвучь свой ролик на другом языке — живой речью, а не роботом

Смотри, идея на одну строку: у тебя есть готовый ролик — рил про кота, короткое демо своего проекта, голосовая с мыслью на ночь. Ты кидаешь его в приложение — и получаешь тот же ролик на английском. Не субтитрами внизу, а голосом. Живым, с интонацией, без роботных пауз. Тебя вдруг понимают те, кто русского не знал.
Это не живой переводчик в наушнике для разговора — такой уже есть. Это про твой готовый контент: взял и переозвучил, чтобы выложить.
Почему это только что стало возможно
Автоперевод речи был или субтитрами, или роботным голосом, который делает паузу после каждой фразы: «перевёл… подождал… сказал». Слушать больно, выкладывать стыдно.
В июне 2026 Google показал Gemini 3.5 Live Translate — отдельную аудио-модель для перевода речь-в-речь. Она сама распознаёт больше 70 языков, сохраняет живую интонацию говорящего и убирает неловкие паузы. Дословно у Google: «плавный, почти реальный разговор без языкового барьера». Впервые перевод твоей речи звучит как речь, а не как голос из лифта. Вот на этом проект и едет.
Чему научишься
Маленький проект, а трогаешь сразу три полезные вещи:
- Достать звук из видео — как отделить аудиодорожку и вернуть её обратно.
- Позвать модель через API — тот же ключ Gemini, что и для картинок. Отправил дорожку → получил перевод голосом.
- Потоковую обработку — почему звук гоняют кусочками, а не файлом целиком, и зачем это тебе.
Магии тут меньше, чем кажется. Приложение — это труба: взяло твой ролик, вынуло звук, отдало модели, приклеило перевод обратно.
Готовый стартовый промпт
Модель послушнее, когда ты задаёшь ей рамки, а не бросаешь «переведи». Вот разница:
переведи это видео на английскийСлабый вариант отдаёт тебе плоский перевод. Сильный — задаёт тон, темп и границы, и на выходе речь, которую реально можно положить на видео.
Что получится
Был рил на 20 секунд, где ты по-русски рассказываешь про свой проект. Стало — тот же рил, тот же ритм, но по-английски, живым голосом. Ты выкладываешь его во второй ленте — и его понимают те, кто вчера пролистывал.
Трезво про рамки: это не студийный дубляж с идеальной синхронностью губ. Голос живой, но это твой контент на новый рынок, а не кино. Именно это новичку и нужно, чтобы что-то показать, а не арендовать студию.
План на выходные
- Пятница, вечер. Возьми ключ Gemini, зайди в AI Studio и прогони одну свою голосовую через Live Translate. Просто послушай, как звучит. Это и есть момент «ого».
- Суббота. Оберни в мини-приложение: загрузил файл → выбрал язык → скачал озвучку. Пока без видео, только звук.
- Воскресенье. Добавь склейку звука обратно к видео и прогони три своих ролика. Один — выложи.
Начни с самого короткого ролика, где ты говоришь один. Хор голосов и музыку добавишь потом — сначала пусть заработает простое.
Короткие уроки-истории, симулятор агента и ежедневная практика — в нашем мобильном приложении. Бесплатно.
Источник: Google — AI-обновления за июнь 2026





