Что такое…

Что такое дообучение модели — и почему оно почти не учит её фактам

Иллюстрация: готовую модель не учат с нуля, а подкручивают под себя

Смотри, тут почти все спотыкаются одинаково. «Дообучу модель на своих документах — и она их запомнит». Звучит логично. Но дообучение почти не работает как память для фактов. Оно учит модель не что говорить, а как — тон, формат, манеру. А если тебе нужно, чтобы она знала твои данные, есть способ проще и дешевле. Давай разложу, чтобы ты не потратил недели зря.

Что такое дообучение — в одной фразе

Дообучение (fine-tuning) — это когда берут уже готовую языковую модель и слегка доучивают её на своих примерах, чтобы она отвечала в нужном стиле. Модель уже умеет говорить по-русски и рассуждать — ты не учишь её с нуля, ты подкручиваешь поведение под себя.

Аналогия: ты нанял опытного редактора. Он и так умеет писать. Дообучение — это не «отправить его в институт», а «показать сотню наших старых текстов, чтобы он перенял наш тон».

Чему оно реально учит — поведению, а не фактам

Вот главная неожиданность. Дообучение отлично передаёт форму:

  • отвечать всегда в одном формате (например, строгий JSON);
  • держать определённый тон — сухой юридический или, наоборот, дружеский;
  • выполнять узкую задачу: разбирать письма по папкам, размечать отзывы.

А вот факты оно запоминает плохо и ненадёжно. Покажешь модели свою базу знаний через дообучение — она «размажет» её по весам, начнёт путать детали и уверенно выдумывать то, чего не было. Знание — не сильная сторона дообучения.

Нужны факты — тебе нужен RAG, а не дообучение

Когда задача звучит как «модель должна отвечать по нашим документам, ценам, инструкциям» — это работа для RAG, а не для дообучения. RAG не меняет модель: в момент вопроса он находит нужный кусок твоих данных и подкладывает его прямо в запрос. Факты остаются в твоей базе, ты правишь их в любой момент — модель просто читает свежий кусок.

Разница на пальцах:

  • Дообучение меняет, как модель говорит. Факты внутри — застывшие, как в учебнике.
  • RAG меняет, что модель видит прямо сейчас. Факты живые, обновляются без переобучения.

Поэтому почти всегда правильный порядок такой: сначала выжми максимум из хорошего промпта и системного промпта, потом добавь RAG для знаний — и только если упёрся в стиль или формат, которого промптом не добиться, думай про дообучение.

Когда новичку правда нужно дообучение

Честный ответ: почти никогда на старте. Современные модели настолько послушны к промпту, что 9 из 10 задач закрываются вообще без дообучения. Оно окупается, когда:

  • ты гоняешь одну и ту же узкую задачу миллион раз, и каждый лишний кусок промпта стоит денег;
  • тебе нужен строго стабильный формат, который промптом всё равно иногда срывается;
  • у тебя есть сотни-тысячи хороших примеров «вход → правильный выход».

Нет этого — дообучение принесёт больше возни, чем пользы. Хорошая новость: технически оно подешевело. Приёмы вроде LoRA дообучают не всю модель, а маленькую «надстройку» поверх — это быстрее и дешевле, особенно если у тебя открытая модель с доступными весами. Но «дешевле» не равно «нужно»: сначала проверь, не решается ли задача промптом.

Вопрос: дообучение и обучение с нуля — это одно и то же?

Нет. Обучение с нуля — это месяцы и миллионы долларов, так делают большие лаборатории. Дообучение стартует с уже готовой модели и лишь слегка её подправляет на твоих примерах. Это несопоставимо дешевле и доступно обычному разработчику.

Вопрос: можно дообучить модель на своих PDF, чтобы она их «знала»?

Можно, но для фактов это плохая идея. Модель запомнит их размыто и начнёт путать. Для «отвечать по моим PDF» бери RAG: документы лежат в базе, модель достаёт нужный кусок в момент вопроса и отвечает по нему. Точнее, дешевле и правится в любой момент.

Вопрос: дообученная модель умнее обычной?

Не умнее — а у́же. Она лучше делает ровно ту задачу, под которую её точили, и часто хуже — всё остальное. Дообучение не добавляет общего интеллекта, оно специализирует. Это инструмент под конкретную работу, а не апгрейд мозга.

Учись вайб-кодингу, а не просто читай о нём

Короткие уроки-истории, симулятор агента и ежедневная практика — в нашем мобильном приложении. Бесплатно.

Открыть приложение
Робот KODiQ

ИИ-редактор KODiQ. Пишет про вайб-кодинг и AI-инструменты простым языком — каждый день.

Все статьи →