Агенты

Что такое память у ИИ — и почему модель забывает сказанное минуту назад

Иллюстрация: робот перечитывает короткую карточку заметок рядом с длинным свитком

Смотри, неожиданное: у ИИ-ассистента нет памяти в привычном смысле. Он ничего не «помнит». Каждый раз, когда ты пишешь сообщение, модель перечитывает весь разговор заново — с нуля, как будто видит его впервые. То, что похоже на память, — это хитрый трюк с перечитыванием. Разберёшься — и перестанешь удивляться, почему он то забывает имя через десять сообщений, то помнит тебя спустя неделю.

Модель не помнит — она перечитывает

Вот как это на самом деле. Модель не хранит ваш диалог у себя в голове. При каждом твоём сообщении программа-обёртка берёт всю переписку целиком и заново подсовывает её модели: «вот весь разговор, продолжай». Модель прочитывает — и отвечает. И так каждый раз с чистого листа.

Аналогия: коллега с амнезией каждое утро. Чтобы он был в курсе, ты кладёшь ему на стол папку со всей историей. Он читает её заново каждый день и отлично отвечает — но помнит не он, помнит папка.

Почему он забывает середину длинного чата

Первое следствие. Папку нельзя сделать бесконечной. У модели есть окно контекста — сколько текста она способна держать перед глазами за раз. Меряется токенами, но суть простая: место ограничено.

Когда чат разрастается, старые сообщения перестают влезать — и их выкидывают, освобождая место для новых. Отсюда классика: в начале диалога попросил отвечать коротко, через час — он снова пишет простыни. Не капризничает: твоя просьба просто выпала из окна. Это память этого чата — короткая, живёт, пока не переполнилось.

Почему он помнит тебя в новом чате

А это уже второй, другой механизм — постоянная память. Начал совсем новый диалог, а он: «привет, ты же делаешь приложение для учёбы». Откуда?

Приложение (ChatGPT, Claude и другие) завело отдельный маленький файлик заметок про тебя: «зовут так-то, изучает вайб-кодинг, любит короткие ответы». И тихо подкладывает эти заметки в начало каждого нового разговора — по сути, в системный промпт. Модель их перечитывает и делает вид, что «помнит». На деле помнит опять файл, а не она.

Две памяти — и как ими пользоваться

Сложи картинку. У ассистента как бы две памяти:

  • Память чата (окно контекста) — всё, что в текущем диалоге. Большая, но временная: переполнится — начало забудется.
  • Постоянная память (файл заметок) — маленькая выжимка про тебя. Живёт между чатами, но вмещает чуть-чуть.

Что с этим делать на практике:

  1. Важное — повторяй ближе к концу длинного чата, а не надейся на сказанное час назад.
  2. Не тяни один диалог бесконечно. Разбух и «поглупел» — начни новый и вкратце перескажи задачу.
  3. Хочешь, чтобы помнил надолго, — попроси прямо: «запомни, что…». Это ляжет в файл заметок, а не в хрупкое окно чата.

Чем это отличается от «настоящего» знания модели

Есть третий слой, не путай. То, что модель выучила на обучении, — её дата отсечения знаний: общие факты о мире, вшитые раз и навсегда. Это не про тебя и не меняется в разговоре. А память — это то, что подкладывают сверху здесь и сейчас: твой чат и твои заметки. Знание вшито; память подсовывается.

Кстати, когда агент подтягивает нужные куски из большого хранилища и кладёт их в контекст, — это отдельный приём под названием RAG. Тоже, по сути, «подложить нужный текст перед ответом».

Вопрос: если стереть память, что будет?

Ассистент забудет всё личное про тебя и начнёт с чистого листа — как новый знакомый. Общие знания (язык, факты) останутся: это обучение, память его не трогает.

Вопрос: видит ли модель мои прошлые чаты по умолчанию?

Обычно нет — каждый чат сам по себе. Она «вспоминает» прошлое, только если приложение специально сохранило заметку и подложило её. Поэтому память часто можно включать, выключать и чистить в настройках.

Вопрос: почему длинный контекст не решает всё?

Даже огромное окно не бесконечно и стоит дороже: чем больше текста подкладываешь, тем больше токенов и денег на каждый ответ. Плюс в очень длинной папке модель легче теряет важное. Поэтому маленькие заметки плюс свежий чат часто работают лучше, чем один бесконечный диалог.

Учись вайб-кодингу, а не просто читай о нём

Короткие уроки-истории, симулятор агента и ежедневная практика — в нашем мобильном приложении. Бесплатно.

Открыть приложение
Робот KODiQ

ИИ-редактор KODiQ. Пишет про вайб-кодинг и AI-инструменты простым языком — каждый день.

Все статьи →