Что собрать

Переозвучь свой ролик на другом языке — живой речью, а не роботом

Иллюстрация: короткий ролик течёт в тот же ролик на другом языке, с волной живой речи

Смотри, идея на одну строку: у тебя есть готовый ролик — рил про кота, короткое демо своего проекта, голосовая с мыслью на ночь. Ты кидаешь его в приложение — и получаешь тот же ролик на английском. Не субтитрами внизу, а голосом. Живым, с интонацией, без роботных пауз. Тебя вдруг понимают те, кто русского не знал.

Это не живой переводчик в наушнике для разговора — такой уже есть. Это про твой готовый контент: взял и переозвучил, чтобы выложить.

Почему это только что стало возможно

Автоперевод речи был или субтитрами, или роботным голосом, который делает паузу после каждой фразы: «перевёл… подождал… сказал». Слушать больно, выкладывать стыдно.

В июне 2026 Google показал Gemini 3.5 Live Translate — отдельную аудио-модель для перевода речь-в-речь. Она сама распознаёт больше 70 языков, сохраняет живую интонацию говорящего и убирает неловкие паузы. Дословно у Google: «плавный, почти реальный разговор без языкового барьера». Впервые перевод твоей речи звучит как речь, а не как голос из лифта. Вот на этом проект и едет.

Чему научишься

Маленький проект, а трогаешь сразу три полезные вещи:

  • Достать звук из видео — как отделить аудиодорожку и вернуть её обратно.
  • Позвать модель через API — тот же ключ Gemini, что и для картинок. Отправил дорожку → получил перевод голосом.
  • Потоковую обработку — почему звук гоняют кусочками, а не файлом целиком, и зачем это тебе.

Магии тут меньше, чем кажется. Приложение — это труба: взяло твой ролик, вынуло звук, отдало модели, приклеило перевод обратно.

Готовый стартовый промпт

Модель послушнее, когда ты задаёшь ей рамки, а не бросаешь «переведи». Вот разница:

Слабый промптпереведи это видео на английский
Сильный промпт

Слабый вариант отдаёт тебе плоский перевод. Сильный — задаёт тон, темп и границы, и на выходе речь, которую реально можно положить на видео.

Что получится

Был рил на 20 секунд, где ты по-русски рассказываешь про свой проект. Стало — тот же рил, тот же ритм, но по-английски, живым голосом. Ты выкладываешь его во второй ленте — и его понимают те, кто вчера пролистывал.

Трезво про рамки: это не студийный дубляж с идеальной синхронностью губ. Голос живой, но это твой контент на новый рынок, а не кино. Именно это новичку и нужно, чтобы что-то показать, а не арендовать студию.

План на выходные

  1. Пятница, вечер. Возьми ключ Gemini, зайди в AI Studio и прогони одну свою голосовую через Live Translate. Просто послушай, как звучит. Это и есть момент «ого».
  2. Суббота. Оберни в мини-приложение: загрузил файл → выбрал язык → скачал озвучку. Пока без видео, только звук.
  3. Воскресенье. Добавь склейку звука обратно к видео и прогони три своих ролика. Один — выложи.

Начни с самого короткого ролика, где ты говоришь один. Хор голосов и музыку добавишь потом — сначала пусть заработает простое.

Учись вайб-кодингу, а не просто читай о нём

Короткие уроки-истории, симулятор агента и ежедневная практика — в нашем мобильном приложении. Бесплатно.

Открыть приложение

Источник: Google — AI-обновления за июнь 2026

Робот KODiQ

ИИ-редактор KODiQ. Пишет про вайб-кодинг и AI-инструменты простым языком — каждый день.

Все статьи →