Кидаешь видео лекции — получаешь конспект с таймкодами

Смотри, идея на одну строку: кидаешь приложению часовую запись лекции или туториала, а оно присылает оглавление с таймкодами. «00:00 — вступление, 02:14 — что такое токен, 09:40 — эмбеддинги, 18:05 — итоги». Тыкаешь на строку — и прыгаешь сразу в нужное место.
И тут самое интересное — год назад так просто не вышло бы. Чтобы «понять» видео, надо было вытащить кадры, отдельно расшифровать звук, потом всё это сшить — целый конвейер. Теперь одна модель смотрит видео и сама отвечает текстом. В мае Gemini 3.5 Flash стал общедоступным: он жуёт видео по цене обычного текста и в разы быстрее старых моделей. А ещё умеет ссылаться на конкретный момент в формате MM:SS — вот на этом таймкоды и держатся.
Почему именно это
Видео копятся у всех: сохранённые лекции, записи созвонов, туториалы на сорок минут. Открыть их потом — лень: непонятно, где там нужная мысль, а перематывать вслепую долго. Оглавление с таймкодами превращает кучу «когда-нибудь посмотрю» в то, чем реально пользуешься.
И «магии» тут меньше, чем кажется. Приложение — это труба: взяло видео, отдало модели, получило список моментов, показало. Вся сложность — в одном хорошем промпте.
Чему научишься
- Видео как ввод. Раньше ты слал модели текст, может, картинку. Тут — целый видеофайл. Модель и смотрит картинку, и слышит звук одновременно.
- Структурированный ответ. Не «перескажи видео словами», а «верни список: таймкод + заголовок главы». Такой ответ можно сразу показать кликабельным списком.
- «Промпт как фича». Разбивка на главы — не отдельная технология. Это инструкция модели: «вот видео, найди смысловые куски и отметь, на какой секунде каждый». Хороший промпт и есть твоя главная функция.
Готовый стартовый промпт
Не проси агента «сделай конспектер видео» — он начнёт угадывать формат и поля. Дай контекст, пример и границы:
Сделай приложение, которое делает конспект из видео.Сильный промпт не оставляет места для догадок: видно сценарий, видно ровно те поля, что нужны (time и title), видно, что с ними делать дальше. Результат с первого раза ближе к тому, что ты хотел.
Что в итоге
Открываешь приложение, выбираешь запись лекции на сорок минут. Через минуту на экране — выжимка в пять строк и оглавление. Видишь: «12:30 — практика». Тыкаешь — плеер прыгает ровно туда. Ты не пересматривал всё подряд и не перематывал вслепую. Ты открыл нужный кусок за один тык.
Начни с одного экрана, доведи до конца — и у тебя будет штука, которая разбирает любое видео за минуту.
Короткие уроки-истории, симулятор агента и ежедневная практика — в нашем мобильном приложении. Бесплатно.





