Наговорил на ходу — а на экране уже аккуратный список дел, а не каша

Смотри, идея на одну строку: ты идёшь по улице и наговариваешь в телефон всё, что в голове — «надо позвонить в банк, кстати идея для лендинга, и не забыть про дедлайн в пятницу». А приложение возвращает не сплошной текст, а разобранный список: задачи отдельно, идеи отдельно, даты подсвечены.
И вот что свежее: дело не только в том, что речь стала текстом — это умели и раньше. Свежее — что текст стал чистым. 2 июня Microsoft показала MAI-Transcribe-1.5: по их словам, лучшая модель транскрипции, в пять раз быстрее конкурентов, на 43 языках — и, что важно, со встроенной поддержкой твоих терминов. Раньше расшифровки спотыкались о жаргон и имена. Теперь — нет.
Почему именно это
Лучшие мысли приходят не за столом — в дороге, в душе, на прогулке. Записать их некогда: пока достанешь блокнот, мысль уже улетела. Наговорить голосом — две секунды. Но обычная расшифровка отдаёт стену текста без знаков препинания, которую потом самому разбирать. А ты хочешь сразу список, по которому можно действовать.
И «магии» тут меньше, чем кажется. Приложение — труба в два колена: сначала модель превращает звук в чистый текст, потом вторая инструкция раскладывает текст по полочкам. Вся сложность — в двух аккуратных запросах.
Чему научишься
- Звук на входе. Ты отправляешь модели не текст, а аудиофайл — и получаешь осмысленный ответ. Это другой тип ввода, чем ты привык.
- Цепочка из двух шагов. Сначала «расшифруй», потом «разложи по категориям». Выход первого шага — вход второго. Так из сырого потока получается структура.
- Структурированный ответ. Не «перескажи, о чём я говорил», а «верни задачи, идеи и даты отдельными списками». Тогда ответ модели можно сразу показать галочками.
Готовый стартовый промпт
Не проси агента «сделай приложение для голосовых заметок» — он сделает диктофон со стеной текста. Опиши обе ступени, формат и пример:
Сделай приложение, которое записывает голос и расшифровывает в заметки.Сильный промпт не оставляет места для догадок: видны обе ступени, виден ровно тот формат, что нужен, и запрет выдумывать. Результат с первого раза ближе к тому, что ты хотел.
Что в итоге
Идёшь с работы, на ходу наговариваешь минуту сумбура. Открываешь приложение — а там уже три аккуратных блока: «Задачи: позвонить в банк, отправить отчёт», «Идеи: лендинг с калькулятором», «Даты: дедлайн — пятница». Ставишь галочки. Ты не печатал. Ты просто поговорил сам с собой по дороге.
Начни с одной кнопки записи, доведи до трёх списков — и у тебя будет блокнот, который успевает за мыслью, а не наоборот.
Короткие уроки-истории, симулятор агента и ежедневная практика — в нашем мобильном приложении. Бесплатно.
Источник: Microsoft: launching seven new MAI models (MAI-Transcribe-1.5)

