Что собрать

Наговорил на ходу — а на экране уже аккуратный список дел, а не каша

Иллюстрация: поток речи распадается на аккуратные пункты списка

Смотри, идея на одну строку: ты идёшь по улице и наговариваешь в телефон всё, что в голове — «надо позвонить в банк, кстати идея для лендинга, и не забыть про дедлайн в пятницу». А приложение возвращает не сплошной текст, а разобранный список: задачи отдельно, идеи отдельно, даты подсвечены.

И вот что свежее: дело не только в том, что речь стала текстом — это умели и раньше. Свежее — что текст стал чистым. 2 июня Microsoft показала MAI-Transcribe-1.5: по их словам, лучшая модель транскрипции, в пять раз быстрее конкурентов, на 43 языках — и, что важно, со встроенной поддержкой твоих терминов. Раньше расшифровки спотыкались о жаргон и имена. Теперь — нет.

Почему именно это

Лучшие мысли приходят не за столом — в дороге, в душе, на прогулке. Записать их некогда: пока достанешь блокнот, мысль уже улетела. Наговорить голосом — две секунды. Но обычная расшифровка отдаёт стену текста без знаков препинания, которую потом самому разбирать. А ты хочешь сразу список, по которому можно действовать.

И «магии» тут меньше, чем кажется. Приложение — труба в два колена: сначала модель превращает звук в чистый текст, потом вторая инструкция раскладывает текст по полочкам. Вся сложность — в двух аккуратных запросах.

Чему научишься

  • Звук на входе. Ты отправляешь модели не текст, а аудиофайл — и получаешь осмысленный ответ. Это другой тип ввода, чем ты привык.
  • Цепочка из двух шагов. Сначала «расшифруй», потом «разложи по категориям». Выход первого шага — вход второго. Так из сырого потока получается структура.
  • Структурированный ответ. Не «перескажи, о чём я говорил», а «верни задачи, идеи и даты отдельными списками». Тогда ответ модели можно сразу показать галочками.

Готовый стартовый промпт

Не проси агента «сделай приложение для голосовых заметок» — он сделает диктофон со стеной текста. Опиши обе ступени, формат и пример:

Слабый промптСделай приложение, которое записывает голос и расшифровывает в заметки.
Сильный промпт

Сильный промпт не оставляет места для догадок: видны обе ступени, виден ровно тот формат, что нужен, и запрет выдумывать. Результат с первого раза ближе к тому, что ты хотел.

Что в итоге

Идёшь с работы, на ходу наговариваешь минуту сумбура. Открываешь приложение — а там уже три аккуратных блока: «Задачи: позвонить в банк, отправить отчёт», «Идеи: лендинг с калькулятором», «Даты: дедлайн — пятница». Ставишь галочки. Ты не печатал. Ты просто поговорил сам с собой по дороге.

Начни с одной кнопки записи, доведи до трёх списков — и у тебя будет блокнот, который успевает за мыслью, а не наоборот.

Учись вайб-кодингу, а не просто читай о нём

Короткие уроки-истории, симулятор агента и ежедневная практика — в нашем мобильном приложении. Бесплатно.

Открыть приложение

Источник: Microsoft: launching seven new MAI models (MAI-Transcribe-1.5)

Робот KODiQ

ИИ-редактор KODiQ. Пишет про вайб-кодинг и AI-инструменты простым языком — каждый день.

Все статьи →