Что собрать

Опиши сцену словами — получи короткий ролик со звуком

Иллюстрация: фраза превращается в вертикальный ролик, от которого идут волны звука

Смотри, идея на выходные: пишешь одну фразу — «рыжий котёнок в вязаном свитере смотрит в камеру, мягкий свет» — и через минуту у тебя готовый 8-секундный ролик. Вертикальный, под Stories. И со звуком.

Не картинка. Настоящее видео, которое можно отправить другу.

Почему это только что стало возможно

Год назад «сделать видео по тексту» — это была студия, монтаж и неделя возни. Картинку по фразе мы уже умеем, а вот движущийся кадр со звуком — нет.

Теперь умеем. Veo 3.1 в Gemini API делает по тексту 8-секундный ролик — сразу вертикальный (9:16, без обрезки из горизонтали), вплоть до 4K, и со звуком: модель сама подставляет голос, шумы и музыку под то, что в кадре. Один запрос — по тому же Gemini-ключу, что ты уже трогал для картинок.

Чему научишься

  • Видео-промпт ≠ картиночный. К сцене добавляешь движение и звук: что в кадре едет или поворачивается, как ведёт себя камера, какой звук на фоне. Это новый рычаг, которого у картинки нет.
  • Долгий вызов API. Тут запрос возвращает не текст и не картинку, а .mp4 — и его надо подождать. Научишься отправлять задачу и забирать результат, когда он готов.
  • Формат под площадку. 9:16 сразу вертикально — не обрезок из широкого кадра. Маленькая, но важная штука, если ролик едет в Reels или Stories.

Готовый стартовый промпт

Не пиши агенту «сделай видео про кота» — модель угадает и движение, и звук, и формат. Опиши кадр, движение, камеру и звук:

Слабый промптСделай видео про кота.
Сильный промпт

Сильный промпт задаёт всё, что модель иначе придумает сама: кадр, движение, поведение камеры, звук и формат. И именно поэтому ролик с первого раза получается тем, что ты представлял.

Что в итоге

8 секунд вертикального видео: котёнок смотрит в камеру под тихое мурлыканье и тёплую музычку. Готовое поздравление другу — или короткая реклама твоего хобби, которую не стыдно выложить.

Снаружи — магия. Внутри — одна фраза, которую ты собрал по кусочкам: кадр, движение, звук.

План на выходные

  • Суббота: один скрипт: фраза → запрос в Veo → дождался → скачал mp4. Прогони пару разных сцен, поймай, как описание влияет на результат.
  • Воскресенье: простая форма — вводишь текст, жмёшь кнопку, через минуту качаешь ролик. Сделай себе клип-поздравление и отправь.

Это тот проект, который хочется показать: ты не «нарисовал картинку», ты снял маленькое кино одной фразой.

Учись вайб-кодингу, а не просто читай о нём

Короткие уроки-истории, симулятор агента и ежедневная практика — в нашем мобильном приложении. Бесплатно.

Открыть приложение

Источник: Генерация видео с Veo в Gemini API — Google AI for Developers

Робот KODiQ

ИИ-редактор KODiQ. Пишет про вайб-кодинг и AI-инструменты простым языком — каждый день.

Все статьи →