RAG или дообучение — как дать модели свои знания
Ты хочешь, чтобы ИИ отвечал по твоим данным — базе знаний компании, твоим документам, своей вики. В интернете первое, что советуют, — «дообучи модель». И вот неожиданность: в 9 случаях из 10 это неправильный ответ. Тебе почти наверняка нужен RAG. Разберём, чем они отличаются и когда что.
Два способа «научить» модель
Это два принципиально разных действия, хотя оба звучат как «дать модели знания».
Дообучение (fine-tuning) меняет саму модель. Ты берёшь готовую и продолжаешь тренировать её на своих примерах. Она усваивает манеру: стиль, формат, тон, тип задач. Представь сотрудника, которого отправили на курсы — он поменял навыки насовсем.
RAG (retrieval-augmented generation) модель не трогает. Перед ответом система находит нужные куски твоих документов и подкладывает их в запрос — как шпаргалку. Модель отвечает, читая эту шпаргалку прямо сейчас. Тот же сотрудник, но ему дали открыть нужную папку перед ответом.
Сравнение на понятных осях
| Критерий | Дообучение (fine-tuning) | RAG (шпаргалка) | |---|---|---| | Что меняет | саму модель (манеру) | ничего; добавляет данные в запрос | | Свежесть данных | застывает на дне обучения | всегда актуальные — правишь документ | | Цена и сложность | высокая: данные, тренировка, повтор | низкая: поиск + подстановка текста | | Источник ответа | не покажет, откуда взял | можно показать, из какого документа | | Быстро обновить факт | переобучать заново | заменить строку в базе | | В чём силён | стиль, формат, узкий навык | факты, документы, свежие знания |
Кому что подойдёт — без увиливаний
Нужен RAG, если твоя цель — чтобы бот знал факты: отвечал по инструкции, базе поддержки, свежим ценам, твоим заметкам. Данные меняются, ты хочешь видеть источник, и у тебя нет тысяч примеров и бюджета на тренировку. Это почти все задачи новичка. Под капотом факты обычно лежат в векторной базе — она ищет по смыслу, а не по точному слову.
Нужно дообучение, если дело не в фактах, а в манере: модель должна всегда отвечать в жёстком формате, копировать твой стиль или уверенно решать узкий тип задач, который плохо объясняется словами. Это дороже и имеет смысл, когда шпаргалкой поведение не выправить.
Частая правда жизни: сначала бери RAG. Он проще, дешевле и покрывает большинство «хочу, чтобы бот знал моё». К дообучению переходят позже и точечно — когда упёрлись именно в манеру, а не в знания.
А можно совместить?
Да, и в серьёзных системах так и делают: дообучение задаёт стиль и формат, RAG подкладывает свежие факты. Но начинать с обоих сразу новичку незачем — почти всегда хватает одного RAG.
RAG — это дорого?
Нет, обычно это самый дешёвый путь. Ты не тренируешь модель, а лишь ищешь нужные куски текста и подставляешь их в запрос. Основная стоимость — те же токены, что и у обычного вопроса.
Дообученная модель знает всё из моих данных наизусть?
Не рассчитывай на это. Дообучение хорошо передаёт манеру, но плохо и ненадёжно запоминает конкретные факты — и они устаревают на дне тренировки. За точные факты отвечает RAG.
Короткие уроки-истории, симулятор агента и ежедневная практика — в нашем мобильном приложении. Бесплатно.


