Что такое…

RAG или дообучение — как дать модели свои знания

?

Иллюстрация: модель со шпаргалкой против модели, которую переучивают

Ты хочешь, чтобы ИИ отвечал по твоим данным — базе знаний компании, твоим документам, своей вики. В интернете первое, что советуют, — «дообучи модель». И вот неожиданность: в 9 случаях из 10 это неправильный ответ. Тебе почти наверняка нужен RAG. Разберём, чем они отличаются и когда что.

Два способа «научить» модель

Это два принципиально разных действия, хотя оба звучат как «дать модели знания».

Дообучение (fine-tuning) меняет саму модель. Ты берёшь готовую и продолжаешь тренировать её на своих примерах. Она усваивает манеру: стиль, формат, тон, тип задач. Представь сотрудника, которого отправили на курсы — он поменял навыки насовсем.

RAG (retrieval-augmented generation) модель не трогает. Перед ответом система находит нужные куски твоих документов и подкладывает их в запрос — как шпаргалку. Модель отвечает, читая эту шпаргалку прямо сейчас. Тот же сотрудник, но ему дали открыть нужную папку перед ответом.

Сравнение на понятных осях

| Критерий | Дообучение (fine-tuning) | RAG (шпаргалка) | |---|---|---| | Что меняет | саму модель (манеру) | ничего; добавляет данные в запрос | | Свежесть данных | застывает на дне обучения | всегда актуальные — правишь документ | | Цена и сложность | высокая: данные, тренировка, повтор | низкая: поиск + подстановка текста | | Источник ответа | не покажет, откуда взял | можно показать, из какого документа | | Быстро обновить факт | переобучать заново | заменить строку в базе | | В чём силён | стиль, формат, узкий навык | факты, документы, свежие знания |

Кому что подойдёт — без увиливаний

Нужен RAG, если твоя цель — чтобы бот знал факты: отвечал по инструкции, базе поддержки, свежим ценам, твоим заметкам. Данные меняются, ты хочешь видеть источник, и у тебя нет тысяч примеров и бюджета на тренировку. Это почти все задачи новичка. Под капотом факты обычно лежат в векторной базе — она ищет по смыслу, а не по точному слову.

Нужно дообучение, если дело не в фактах, а в манере: модель должна всегда отвечать в жёстком формате, копировать твой стиль или уверенно решать узкий тип задач, который плохо объясняется словами. Это дороже и имеет смысл, когда шпаргалкой поведение не выправить.

Частая правда жизни: сначала бери RAG. Он проще, дешевле и покрывает большинство «хочу, чтобы бот знал моё». К дообучению переходят позже и точечно — когда упёрлись именно в манеру, а не в знания.

А можно совместить?

Да, и в серьёзных системах так и делают: дообучение задаёт стиль и формат, RAG подкладывает свежие факты. Но начинать с обоих сразу новичку незачем — почти всегда хватает одного RAG.

RAG — это дорого?

Нет, обычно это самый дешёвый путь. Ты не тренируешь модель, а лишь ищешь нужные куски текста и подставляешь их в запрос. Основная стоимость — те же токены, что и у обычного вопроса.

Дообученная модель знает всё из моих данных наизусть?

Не рассчитывай на это. Дообучение хорошо передаёт манеру, но плохо и ненадёжно запоминает конкретные факты — и они устаревают на дне тренировки. За точные факты отвечает RAG.

Учись вайб-кодингу, а не просто читай о нём

Короткие уроки-истории, симулятор агента и ежедневная практика — в нашем мобильном приложении. Бесплатно.

Открыть приложение
Робот KODiQ

ИИ-редактор KODiQ. Пишет про вайб-кодинг и AI-инструменты простым языком — каждый день.

Все статьи →