[Перевод] Квантизация с нуля: как запустить 160ГБ LLM на ноутбуке и не потерять в качестве

Операция выполнена!

info@vsetut.pro

Стать автором

Вернуться

[Перевод] Квантизация с нуля: как запустить 160ГБ LLM на ноутбуке и не потерять в качестве

26.03.2026 14:57:50 | Хабр

Хабы: Искусственный интеллект, Машинное обучение, Natural Language Processing

Qwen-3-Coder-Next — модель с 80 миллиардами параметров и весом 159,4 ГБ. Примерно столько RAM потребовалось бы для её запуска, и это ещё без учёта длинного контекстного окна. И эта модель не считается большой моделью! По слухам, у frontier-моделей более триллиона параметров, для которых понадобилось бы минимум 2 ТБ оперативной памяти. Последний раз я видел столько RAM в одной машине — никогда.

Но что если я скажу, что можно сделать LLM в 4 раза меньше и в 2 раза быстрее — достаточно, чтобы запускать весьма мощные модели на ноутбуке, — при потере точности всего 5–10%?

В этом и заключается магия квантизации.

В этой статье вы узнаете:
– Почему параметры модели делают её такой большой
– Как работает точность чисел с плавающей точкой и чем жертвуют модели
– Как сжимать числа с плавающей точкой с помощью квантизации
– Как измерить потерю качества модели после квантизации

Читать далее

Подробнее

Читайте также

Вайб-кодинг: конструктор для профи или магия для новичков? Разбираемся на реальном кейсе
26.03.2026 14:51:53 | Хабр

В России создали интеллектуальные системы для прогноза пожаров и паводков
26.03.2026 14:48:32 | ferra.ru

Китайская компания CXMT благодаря буму ИИ достигла рекордной выручки в преддверии IPO
26.03.2026 14:45:58 | it-world

Когда фреймворки бессильны: четыре задачи без готовых ответов
26.03.2026 14:39:23 | Хабр

Неудобные вопросы про бэкап PostgreSQL: где заканчивается СУБД и начинается оркестрация
26.03.2026 14:38:53 | Хабр

ИИ фотосессия по фото 2026 — ТОП-10 лучших нейронок для генерации картинок онлайн по фотографии
26.03.2026 14:37:27 | Хабр

В России научили ИИ выявлять несогласованные граффити на улицах городов
26.03.2026 14:33:24 | ferra.ru

OnePlus выпустила беспроводную зарядку с поворотной подставкой и вентилятором
26.03.2026 14:26:21 | ferra.ru

В России создали износостойкий материал для промышленности
26.03.2026 14:25:59 | ferra.ru

Game Over для мышления? Динамическая теория человеческой агентности в эпоху ИИ
26.03.2026 14:18:59 | Хабр

[Перевод] Запускаем бортовой компьютер Tesla Model 3 на своём столе, используя детали от разбитых автомобилей
26.03.2026 14:17:45 | Хабр

Собираем NetFlow-статистику через eBPF: от физических серверов до K8s
26.03.2026 14:15:42 | Хабр

Мы шьём обувь в Сибири и делаем 15 млн в год без маркетплейсов
26.03.2026 14:06:14 | Хабр

Temporal Tables в MS SQL Server: история изменений
26.03.2026 14:05:40 | Хабр

Paperclip: Я нанял ИИ-компанию из 8 спецов, а они 2 дня пили пиво и смотрели в потолок
26.03.2026 14:00:38 | Хабр

Что внутри «Штурвала 2.13». Декларативная установка, переход на containerd 2.x, профили кластеров и прочее
26.03.2026 13:56:23 | Хабр

Минфин предложил протестировать прослеживаемость цифрового рубля
26.03.2026 13:52:32 | ferra.ru

Как ИТ-отрасль перестроит маркетинг и рекламу в 2026 году
26.03.2026 13:39:00 | it-world

Как кофе влияет на мозг на самом деле: что показывают свежие исследования
26.03.2026 13:38:49 | Хабр

Путь к экзокортексу: взгляд в будущее и суровая реальность
26.03.2026 13:35:38 | Хабр

Учим Linux: Пользователи и группы
26.03.2026 13:33:21 | Хабр

Вот почему твоему ИИ-агенту нужен ACP в IDE
26.03.2026 13:32:16 | Хабр

Reddit запланировал использовать Face ID, Touch ID и ключи доступа для подтверждения «человечности» пользователей и борьбы с ботами и спамом
26.03.2026 13:28:58 | vc.ru

SOLID в реальном мире: SRP без архитектурных космолетов
26.03.2026 13:17:55 | Хабр

Как заставить LLM считать точно: генерация кода вместо генерации ответов
26.03.2026 13:15:59 | Хабр

От нуля до продакшена: как команда без ML-экспертизы построила AI-ассистента для звонков
26.03.2026 13:15:30 | Хабр

Базовый минимум или роскошный максимум: как устроен IaaS в MWS Cloud Platform
26.03.2026 13:09:45 | Хабр

В Казани создали систему для точного контроля поперечного уровня рельсового пути
26.03.2026 13:05:40 | ferra.ru

Проект Terafab: как и зачем Илон Маск строит фабрику чипов за десятки миллиардов
26.03.2026 13:00:24 | Хабр

T2 на некоторых тарифах приравнял звонки в роуминге к звонкам по России — но звонить можно только на российские номера
26.03.2026 12:51:04 | vc.ru

История Кэмпа: путь от сервиса «человек-человек» к AI-экосистеме для студентов
26.03.2026 12:47:43 | Хабр

CyBOK. Глава 3. Законы и регуляторные нормы. Часть 7
26.03.2026 12:40:48 | Хабр

Новый способ охлаждения дата-центров предложили российские ученые
26.03.2026 12:39:24 | ferra.ru

[Перевод] Как AWS S3 обеспечивает скорость 1 петабайт в секунду при помощи медленных HDD
26.03.2026 12:37:57 | Хабр

Береги скин смолоду: как угоняют аккаунты Steam
26.03.2026 12:37:24 | Хабр

Смотреть все

НОВОСТИ

Названы десять поломок, которые водители готовы починить сами
28.03.2026 14:30:00 | За рулем

Грузчик в аэропорту швырял гитары пассажиров, попал на видео и прослыл в сети позорищем
26.03.2026 19:14:27 | Lenta.ru

Алсу сообщила о смерти очень близкого для её семьи человека
26.03.2026 19:12:25 | Life.ru

Глава комитета ГД Слуцкий рассказал о целях визита российских депутатов в США
26.03.2026 19:12:00 | Российская Газета

Трамп преуменьшил рост цен на бензин в попытке успокоить налогоплательщиков
26.03.2026 19:12:00 | Российская Газета

Варламов захотел купить амулет от алкоголизма в Японии
26.03.2026 19:11:25 | Lenta.ru

Арестованный в Польше археолог Бутягин написал две книги в СИЗО
26.03.2026 19:11:11 | Lenta.ru

Посольство РФ готово подключиться к делу об исчезновении россиянки в Сербии
26.03.2026 19:10:50 | ТАСС

В МВД опровергли проверку смартфонов россиян на предмет Telegram
26.03.2026 19:10:15 | Lenta.ru

В России рассказали о росте числа запросов на установку стационарных телефонов
26.03.2026 19:10:00 | Lenta.ru

Поврежденный из-за боевых действий корт в Луганске восстановят в 2026 году
26.03.2026 19:08:48 | ТАСС

Минфин США заявил о росте объемов морских перевозок в зоне Персидского залива
26.03.2026 19:08:46 | ТАСС

В МФТИ помогли создать новую модель стереозрения для роботов
26.03.2026 19:08:44 | ТАСС

Начальник розыска отправил осуждённых строить дом себе и матери в Кузбассе
26.03.2026 19:08:20 | Life.ru

Каллас призвала США искать выход из войны с Ираном
26.03.2026 19:07:52 | Lenta.ru

Москвичей предупредили о наказании за мойку машин во дворе
26.03.2026 19:07:44 | Lenta.ru

Способность клещей прыгать на людей оценили
26.03.2026 19:06:24 | Lenta.ru

Оренбургские предприниматели предложили увеличить пошлины на импортное оборудование
26.03.2026 19:05:57 | ТАСС

В Нью-Йорке началось второе судебное заседание по делу Мадуро
26.03.2026 19:04:54 | ТАСС

ДОМ.РФ разместил ESG-облигации на 245 млрд рублей
26.03.2026 19:02:25 | ТАСС

Трамп сделал заявление о России и Украине
26.03.2026 19:02:00 | Lenta.ru

В Северной Осетии на бизнесмена завели дело за неуплату налогов
26.03.2026 19:01:44 | ТАСС

Жизни самой тяжело пострадавшей при взрыве в Севастополе ничего не угрожает
26.03.2026 19:01:15 | ТАСС

В МВД ответили на проверку телефонов в Белгородской области
26.03.2026 19:01:12 | Lenta.ru

В Нью-Йорке мигранта обвинили в убийстве в метро 83-летнего ветерана ВВС США
26.03.2026 19:01:00 | Российская Газета

Румыния ввела кризисное положение на нефтяном рынке из-за роста цен
26.03.2026 19:00:48 | Life.ru

"Он истощен и обессилен, но тянется к людям": как в Иркутске спасают медвежонка Ежика
26.03.2026 19:00:00 | ТАСС

Трамп назвал контроль нефти Ирана возможным вариантом действий
26.03.2026 18:59:32 | ТАСС

Подворье: пострадавших в русском монастыре на Афоне из-за землетрясения нет
26.03.2026 18:59:12 | ТАСС

«Мотивация не будет высока»: Сёмин сделал неожиданное заявление о ближайших матчах сборной России
26.03.2026 18:58:58 | Life.ru

В Петербурге будут массово искать нелегальных гидов по крышам
26.03.2026 18:58:56 | ТАСС

Американец сместил китайского конкурента на российском авторынке
26.03.2026 18:58:40 | Lenta.ru

Силы ПВО за пять часов уничтожили 96 дронов ВСУ над регионами России
26.03.2026 18:57:43 | Life.ru

Пострадавшего при аварии в Марковке ЛНР доставили в больницу
26.03.2026 18:57:35 | ТАСС

Особенность российской УБИМ показали на видео
26.03.2026 18:57:07 | Lenta.ru

Все новости

ВСЕ НОВОСТИ

ПИШИТЕ

Техническая поддержка проекта ВсеТут

info@vsetut.pro

Copyright © 2026 - vsetut.pro