Что такое открытые веса — и почему это не то же самое, что open source

Смотри, тут путаница на ровном месте. Модель называют «открытой» — и ты думаешь: «о, как open source, весь код наружу». А на деле тебе дали только готовый результат — числа внутри модели. Как они получились, на каких данных — это часто закрыто. «Открытые веса» и «open source» — разные вещи, и разницу полезно понимать ещё до того, как качаешь первую модель.
Что такое «веса» — и почему они и есть модель
Любая языковая модель — это, по сути, гигантская таблица чисел. Эти числа называют весами: модель подкрутила их за время обучения, и именно в них «зашит» весь её навык. Когда модель отвечает, она перемножает эти числа. Веса — это и есть мозг.
«Открытые веса» (open weights) значит: компания выложила эти числа в общий доступ. Ты их скачиваешь — и у тебя на руках полноценная модель, которую можно запускать самому.
Чем это отличается от open source
Вот ключевой момент. Open source в классическом смысле — это когда открыто всё, что нужно, чтобы воспроизвести продукт: исходники, рецепт сборки. Для модели «полностью открыто» значило бы три вещи: веса + код обучения + сами данные, на которых учили.
Открытые веса дают тебе обычно только первое — готовые числа. А рецепт (как именно учили) и особенно данные чаще всего закрыты.
| Что даёт | Открытые веса | Полный open source | |----------|:-------------:|:------------------:| | Скачать и запустить модель | да | да | | Дообучить под себя | да | да | | Код обучения | иногда | да | | Данные, на которых учили | почти никогда | да | | Повторить модель с нуля | нет | да |
Аналогия: тебе отдали готовый рабочий торт и разрешили резать его и украшать как хочешь. Но рецепт и список ингредиентов не дали. Испечь точно такой же с нуля ты не сможешь — а вот пользоваться и переделывать под себя сколько угодно.
Поэтому известные «открытые» модели (Llama, Qwen, DeepSeek) корректнее называть open-weight, а не open source: веса открыты, данные — нет.
Что тебе это даёт на практике
Даже без рецепта открытые веса — это много. С моделью на руках ты можешь:
- запускать её локально — на своём компьютере, бесплатно и приватно, без отправки данных в чужое облако;
- дообучить её под свою задачу (см. дообучение модели);
- не зависеть от одной компании — модель твоя, её не «выключат» и не поднимут цену завтра.
Большие модели тяжёлые, но их ужимают квантизацией, и многие открытые модели спокойно крутятся на обычном ноутбуке.
А лицензия? «Открытые» не значит «делай что хочешь»
Важная ловушка. Скачать веса можно, но что тебе разрешено с ними делать — определяет лицензия. Некоторые открытые модели свободны даже для коммерции (лицензии вроде Apache 2.0 или MIT — самые безопасные). У других есть оговорки: например, ограничения для очень крупных компаний. Собираешься продавать продукт на такой модели — прочитай лицензию до того, как встроил её. Это две минуты, которые экономят большие проблемы.
Кстати, это одна из осей в выборе открытых или закрытых моделей — приватность и контроль против удобства готового облака.
Вопрос: открытые веса — это бесплатно?
Сами веса — почти всегда да, скачиваешь без денег. Но «бесплатно скачать» не равно «бесплатно использовать в продукте»: это решает лицензия. И запуск стоит ресурсов — большая модель требует мощного железа или оплаченного облака. Бесплатен файл, не обязательно вся затея.
Вопрос: чем открытая модель отличается от ChatGPT или Claude?
ChatGPT и Claude — закрытые: ты ходишь к ним через интернет, веса тебе не отдают, моделью владеет компания. Открытую модель ты скачиваешь и держишь у себя. Закрытые обычно умнее на пике, зато открытые — приватнее, дешевле в потоке и полностью под твоим контролем.
Вопрос: я смогу запустить открытую модель на своём ноуте?
Маленькую и среднюю — вполне, особенно в сжатом (квантизированном) виде. Гигантские потребуют серьёзной видеокарты. Правило простое: смотри, сколько модель весит в гигабайтах, и сравнивай со своей памятью. Влезает — запустится.
Короткие уроки-истории, симулятор агента и ежедневная практика — в нашем мобильном приложении. Бесплатно.





