Что такое память у ИИ — и почему модель забывает сказанное минуту назад

Смотри, неожиданное: у ИИ-ассистента нет памяти в привычном смысле. Он ничего не «помнит». Каждый раз, когда ты пишешь сообщение, модель перечитывает весь разговор заново — с нуля, как будто видит его впервые. То, что похоже на память, — это хитрый трюк с перечитыванием. Разберёшься — и перестанешь удивляться, почему он то забывает имя через десять сообщений, то помнит тебя спустя неделю.
Модель не помнит — она перечитывает
Вот как это на самом деле. Модель не хранит ваш диалог у себя в голове. При каждом твоём сообщении программа-обёртка берёт всю переписку целиком и заново подсовывает её модели: «вот весь разговор, продолжай». Модель прочитывает — и отвечает. И так каждый раз с чистого листа.
Аналогия: коллега с амнезией каждое утро. Чтобы он был в курсе, ты кладёшь ему на стол папку со всей историей. Он читает её заново каждый день и отлично отвечает — но помнит не он, помнит папка.
Почему он забывает середину длинного чата
Первое следствие. Папку нельзя сделать бесконечной. У модели есть окно контекста — сколько текста она способна держать перед глазами за раз. Меряется токенами, но суть простая: место ограничено.
Когда чат разрастается, старые сообщения перестают влезать — и их выкидывают, освобождая место для новых. Отсюда классика: в начале диалога попросил отвечать коротко, через час — он снова пишет простыни. Не капризничает: твоя просьба просто выпала из окна. Это память этого чата — короткая, живёт, пока не переполнилось.
Почему он помнит тебя в новом чате
А это уже второй, другой механизм — постоянная память. Начал совсем новый диалог, а он: «привет, ты же делаешь приложение для учёбы». Откуда?
Приложение (ChatGPT, Claude и другие) завело отдельный маленький файлик заметок про тебя: «зовут так-то, изучает вайб-кодинг, любит короткие ответы». И тихо подкладывает эти заметки в начало каждого нового разговора — по сути, в системный промпт. Модель их перечитывает и делает вид, что «помнит». На деле помнит опять файл, а не она.
Две памяти — и как ими пользоваться
Сложи картинку. У ассистента как бы две памяти:
- Память чата (окно контекста) — всё, что в текущем диалоге. Большая, но временная: переполнится — начало забудется.
- Постоянная память (файл заметок) — маленькая выжимка про тебя. Живёт между чатами, но вмещает чуть-чуть.
Что с этим делать на практике:
- Важное — повторяй ближе к концу длинного чата, а не надейся на сказанное час назад.
- Не тяни один диалог бесконечно. Разбух и «поглупел» — начни новый и вкратце перескажи задачу.
- Хочешь, чтобы помнил надолго, — попроси прямо: «запомни, что…». Это ляжет в файл заметок, а не в хрупкое окно чата.
Чем это отличается от «настоящего» знания модели
Есть третий слой, не путай. То, что модель выучила на обучении, — её дата отсечения знаний: общие факты о мире, вшитые раз и навсегда. Это не про тебя и не меняется в разговоре. А память — это то, что подкладывают сверху здесь и сейчас: твой чат и твои заметки. Знание вшито; память подсовывается.
Кстати, когда агент подтягивает нужные куски из большого хранилища и кладёт их в контекст, — это отдельный приём под названием RAG. Тоже, по сути, «подложить нужный текст перед ответом».
Вопрос: если стереть память, что будет?
Ассистент забудет всё личное про тебя и начнёт с чистого листа — как новый знакомый. Общие знания (язык, факты) останутся: это обучение, память его не трогает.
Вопрос: видит ли модель мои прошлые чаты по умолчанию?
Обычно нет — каждый чат сам по себе. Она «вспоминает» прошлое, только если приложение специально сохранило заметку и подложило её. Поэтому память часто можно включать, выключать и чистить в настройках.
Вопрос: почему длинный контекст не решает всё?
Даже огромное окно не бесконечно и стоит дороже: чем больше текста подкладываешь, тем больше токенов и денег на каждый ответ. Плюс в очень длинной папке модель легче теряет важное. Поэтому маленькие заметки плюс свежий чат часто работают лучше, чем один бесконечный диалог.
Короткие уроки-истории, симулятор агента и ежедневная практика — в нашем мобильном приложении. Бесплатно.





