Что такое температура у модели — ползунок между скукой и фантазией
Смотри, забавная штука. Задай модели один и тот же вопрос десять раз. Иногда получишь десять почти одинаковых ответов. А иногда — десять разных, и парочку совсем диких.
Разницу решает один маленький параметр. Называется температура.
Это как ползунок: с одного края — «скучно и предсказуемо», с другого — «творчески и рискованно». И ты можешь его двигать.
Как модель вообще выбирает слова
Сначала про то, что под капотом. Без этого температура — пустое слово.
Модель пишет ответ по одному кусочку за раз. На каждом шаге она прикидывает: какое слово идёт следующим?
И тут важное. У неё не один кандидат, а целый список. Каждому она в уме ставит вес: это очень вероятно, это так себе, а это вряд ли.
Температура решает, насколько строго она держится за самый вероятный вариант.
Ноль — отличник, который боится ошибиться
Поставь температуру в ноль (или около того).
Тогда модель почти всегда берёт самый вероятный кусочек. Без фантазии, без риска. Тот же вопрос — почти тот же ответ, раз за разом.
Это как отличник у доски: говорит строго по учебнику, лишнего слова не скажет. Надёжно, но скучновато.
Зато ошибается реже. Поэтому ноль хорош там, где нужна точность.
Повыше — поэт, который любит рискнуть
Подними температуру — и модель смелеет.
Теперь она нет-нет да и выберет не самый очевидный вариант, а второй или третий. Ответы становятся разнообразнее и живее. Спросишь дважды — получишь два разных текста.
Это как друг, который фонтанирует идеями: половина — золото, половина — мимо.
Но есть плата. Чем выше ползунок, тем чаще модель уходит в сторону и может приврать. Подняли слишком сильно — и текст превращается в кашу.
Куда крутить под твою задачу
Запоминать числа не нужно. Держи в голове сам ползунок.
- Факты, код, перевод, инструкции — крути вниз. Тут нужен один верный ответ, а не десять разных.
- Идеи, мозговой штурм, тексты, имена — крути вверх. Тут разнообразие в плюс, а небольшая дичь даже бодрит.
- Не знаешь — оставь как есть. У моделей по умолчанию середина, и для большинства задач этого хватает.
Многие чаты не показывают этот ползунок прямо. Но в настройках или через API он часто есть — поищи слово «temperature».
Как только щёлкает, что это просто регулятор «строгость против фантазии», ты перестаёшь гадать. Скучный ответ? Ничего сломалось — просто крутани ползунок.
Короткие уроки-истории, симулятор агента и ежедневная практика — в нашем мобильном приложении. Бесплатно.