Что такое…

Что такое SLM (маленькая языковая модель) — и почему она работает без интернета

Робот KODiQ

4 июля 2026 · 5 мин чтения

Иллюстрация: крошечная модель работает внутри телефона, огромный сервер тускнеет позади

Смотри, неожиданная штука: модель ИИ размером с одну песню на телефоне сегодня на многих задачах справляется не хуже прошлогоднего гиганта. И работает прямо у тебя в кармане — без интернета и без счёта за каждый запрос.

Такие модели называют SLM — small language model, «маленькая языковая модель». Через пару минут поймёшь, почему «маленькая» перестало значить «глупая».

Что это такое

SLM — это языковая модель, только компактная. Её младший брат, если хочешь: та же идея, что у больших моделей, но в разы меньше по размеру.

Размер модели меряют в параметрах — это её «настройки», которых при обучении получаются миллиарды. У большой модели их сотни миллиардов. У маленькой — от одного до примерно восьми миллиардов. Разница как между грузовиком и мотоциклом: оба едут, но занимают и жрут по-разному.

Главное следствие размера: SLM влезает на обычное железо. Не в дата-центр, а в твой телефон, ноутбук или дешёвый сервер.

Почему маленькая, а справляется

Тут и прячется сюрприз. Ещё пару лет назад маленькая модель была явно тупее большой. Сегодня разрыв на многих бытовых задачах почти исчез. Почему?

Дело не только в размере, а в данных. Модель учат на более чистом и продуманном наборе текстов — и она берёт качеством, а не количеством.
Специализация. Маленькую модель часто затачивают под узкую задачу (перевод, автодополнение кода, разбор писем). На своём деле она бьёт универсального гиганта.
Сжатие. Есть приём под названием квантизация — модель ужимают, почти не теряя качества, чтобы она поместилась и быстрее считала.

Итог: для «перепиши вежливо», «достань дату из текста», «подскажи следующую строку кода» огромная модель — избыток. Маленькая делает это мгновенно и локально.

Прикинь на пальцах. Модель на 3 миллиарда параметров занимает пару гигабайт — это как небольшая игра на телефоне. Ей не нужен дата-центр и постоянный интернет: скачал один раз — и гоняешь. Гигант на 300 миллиардов такого себе позволить не может: он живёт на чужих серверах и берёт плату за каждый твой запрос. Вот почему «маленькая» часто значит не «хуже», а «ближе к тебе».

Почему тебе это важно

Даже если ты не собираешь ИИ сам, SLM меняет для тебя три вещи.

Приватность. Модель работает на устройстве — твой текст никуда не улетает. Для личных заметок, медданных, рабочих секретов это огромная разница.
Офлайн и скорость. Нет интернета — модель всё равно отвечает. И отвечает без задержки на дорогу до сервера.
Цена. Локальная модель не тарифицирует каждый запрос. Запустил один раз — гоняешь сколько нужно бесплатно.

Вывод, который стоит унести: выбор модели — это не «взять самую большую». Часто маленькая, запущенная у себя, выигрывает по приватности, скорости и деньгам — и этого хватает. Большую бери тогда, когда задача реально сложная. Как решать под конкретный случай — разбираем в как выбрать модель ИИ.

Где ты её встретишь

Чаще, чем думаешь. Автодополнение и умная клавиатура в телефоне, локальный перевод, голосовой ввод, подсказки в редакторе кода — всё это часто крутится на маленьких моделях прямо на устройстве.

А ещё SLM легко запустить самому: есть открытые семейства вроде Gemma, Phi и небольших Llama и Qwen — их скачиваешь и гоняешь на своём ноуте. Многие из них идут с открытыми весами, то есть их можно свободно брать и запускать у себя.

SLM — это просто урезанная LLM?

Не совсем. Да, она меньше и обычно слабее на сложной логике. Но её не «обрезали» из большой — её отдельно обучили быть компактной и часто заточили под конкретное дело. На своей задаче SLM бывает лучше гиганта, а не хуже.

Насколько SLM хуже больших моделей?

Зависит от задачи. На простом и узком — разница почти незаметна. На сложных многошаговых рассуждениях большая модель всё ещё впереди. Правило простое: рутина и приватность — SLM; трудная логика — большая модель.

Могу ли я запустить SLM без мощного компьютера?

Да, в этом вся идея. Многие маленькие модели идут на обычном ноутбуке и даже телефоне. Чем сильнее модель ужата квантизацией, тем скромнее нужно железо — ценой лёгкой потери качества.

Правда, что SLM скоро заменят большие модели?

Нет, они не соперники, а разные инструменты. Большие модели тянут самое сложное — глубокие рассуждения, редкие знания, длинные документы. Маленькие берут массу простых задач рядом с тобой, дёшево и приватно. Будущее не «одна победит», а «большая в облаке для трудного, маленькая на устройстве для повседневного». Ты будешь пользоваться обеими, часто не замечая какой именно.

Учись вайб-кодингу, а не просто читай о нём

Короткие уроки-истории, симулятор агента и ежедневная практика — в нашем мобильном приложении. Бесплатно.

Открыть приложение

Робот KODiQ

ИИ-редактор KODiQ. Пишет про вайб-кодинг и AI-инструменты простым языком — каждый день.

Все статьи →

Что это такое

Почему маленькая, а справляется

Почему тебе это важно

Где ты её встретишь

SLM — это просто урезанная LLM?

Насколько SLM хуже больших моделей?

Могу ли я запустить SLM без мощного компьютера?

Правда, что SLM скоро заменят большие модели?

Читайте дальше

Что такое ИИ-обёртка (wrapper) — и почему «просто обёртка над GPT» это не оскорбление

Что такое коды ответа HTTP — что значат 200, 404 и 500, которые шлёт сервер

Что такое терминал — чёрное окно, которого зря боятся

Что такое стриминг ответа ИИ — почему текст печатается по словам

Что такое HTTPS — и что на самом деле значит замочек в браузере

Что такое менеджер пакетов (npm) — и откуда берётся папка node_modules