Операция выполнена!

info@vsetut.pro

Стать автором

Вернуться

[Перевод] Квантизация больших языковых моделей: FP32, BF16, INT8, NF4 и QLoRA

15.05.2026 12:57:43 | Хабр

Хабы: Машинное обучение, Алгоритмы, Высоконагруженные системы, Облачные вычисления, Big Data

Большие языковые модели требуют огромных объёмов памяти. Например, модель с 8 миллиардами параметров в формате FP16 занимает 24–27 ГБ памяти только для инференса (веса, кэш ключей-значений, буферы). Для полного обучения той же модели нужно уже 84–128 ГБ памяти. Даже с такими методами, как checkpointing активаций или offloading на CPU, требования остаются высокими, особенно для моделей с 70 миллиардами параметров.

Квантизация помогает снизить требования к памяти, уменьшая точность представления весов модели без значительной потери качества. В этой статье разберём основные форматы числовой точности, используемые в квантизации LLM, их особенности и ограничения. Также рассмотрим NF4 — ключевую инновацию из статьи про QLoRA, и разберём, зачем нужны такие методы, как блочная квантизация, двойная квантизация и квантизация по квантилям.

Читать далее

Подробнее

Читайте также

Предиктивный автоскейлинг в Kubernetes: масштабируемся на опережение
15.05.2026 12:56:55 | Хабр

Эх, ухнем? В России выпустили акустику «Шаляпин» с опорой на «русский бас»
15.05.2026 12:45:31 | it-world

[Перевод] Kotlin переходит к деструктурированию по именам
15.05.2026 12:36:34 | Хабр

Как мы пытаемся снизить возвраты животных из приютов с помощью NLP
15.05.2026 12:36:28 | Хабр

Домашний мобильный прокси
15.05.2026 12:35:38 | Хабр

Когда онбординг длится 2 месяца: день 3 — проследить главный поток данных
15.05.2026 12:34:04 | Хабр

PromoPersona: как мы персонализировали промо-коллажи с помощью FLUX.2
15.05.2026 12:23:41 | Хабр

Инсайдер: процессор Snapdragon 8 Elite Gen 6 Pro будет дороже бюджетных смартфонов
15.05.2026 12:08:04 | ferra.ru

Рынок запчастей для инфраструктурного оборудования накрыло волной контрафакта
15.05.2026 12:04:33 | it-world

Умный пылесос Dreame L40s Pro Ultra: полгода спустя. Хорошее и плохое — чего больше?
15.05.2026 11:55:37 | Хабр

Учёт оборудования на предприятии: почему ломается на 500+ единицах и как это починить
15.05.2026 11:51:05 | Хабр

Кто такие инженеры по данным и почему они зарабатывают больше других аналитиков
15.05.2026 11:43:43 | Хабр

Сгенерировать курсовую работу онлайн через Kampus AI — как студенты делают работы быстрее
15.05.2026 11:42:01 | Хабр

Массовое внедрение ИИ не принесло компаниям ожидаемой выгоды
15.05.2026 11:41:46 | it-world

Отчёт «Делимобиля» за квартал: выручка — 6,6 млрд рублей, убыток — 1 млрд рублей
15.05.2026 11:38:56 | vc.ru

В МАИ создали робота для поиска брака на конвейере
15.05.2026 11:25:02 | ferra.ru

[Перевод] В логах Kibana лежат тест-кейсы. Вот CLI, чтобы их достать. С auth, заскрабленным по умолчанию
15.05.2026 11:23:51 | Хабр

Новый бенчмарк по кодингу для LLM ProgramBench: 9 топ моделей, 200 задач, 248 тысяч тестов. Полностью решённых — ноль
15.05.2026 11:19:50 | Хабр

Отчетность для совета директоров: какие метрики показывают реальное состояние проектов
15.05.2026 11:19:30 | Хабр

Комплексный подход к корпоративной кибербезопасности. Разговор с директором UserGate uFactor Дмитрием Шулининым
15.05.2026 11:17:14 | Хабр

Часть 3. Фотон4D. Проектируем апгрейд действующей системы
15.05.2026 11:13:12 | Хабр

Точка в дизайне: как самый маленький элемент задаёт настроение и ритм
15.05.2026 10:44:13 | Хабр

Как собрать пайплайн с LLM агентом который фиксит нативные Android UI автотесты
15.05.2026 10:19:43 | Хабр

«Т-Банк» запустил переводы на карты UnionPay Global в 61 страну, включая Францию, Германию, Бельгию и Испанию
15.05.2026 10:18:31 | vc.ru

Менделеевская олимпиада по химии стала углеродно-нейтральной
15.05.2026 10:18:12 | ferra.ru

«Лучшая антиреклама ИИ»: в соцсетях высмеяли рекламу функции улучшения фотографий в смартфоне Xperia 1 VIII от Sony
15.05.2026 10:14:55 | vc.ru

Apple всё же разрешит загружать ИИ-агентов в App Store
15.05.2026 10:08:07 | ferra.ru

Т-Банк запустил переводы на карты UnionPay в 61 страну
15.05.2026 10:00:54 | ferra.ru

Страшно, когда не видно: темные тайны систем виртуализации
15.05.2026 09:48:07 | Хабр

AI Governance по‑инженерному: что должен знать архитектор
15.05.2026 09:40:46 | Хабр

[Перевод] Почему сеньор-разработчик не может донести ценность своего опыта
15.05.2026 09:28:47 | Хабр

Kafka, таксономии и удаление событий: как исключить обработку неактуальных сообщений
15.05.2026 09:23:47 | Хабр

Об организации труда ИИ-агентов
15.05.2026 09:21:26 | Хабр

Минфин сообщил о внедрении ИИ в работу правительства
15.05.2026 09:17:09 | ferra.ru

Ускорение запросов в PostgreSQL: три рычага оптимизации и практический разбор
15.05.2026 09:12:18 | Хабр

Смотреть все

НОВОСТИ

В Суздале состоялся концерт Дениса Мацуева
13.07.2026 02:47:44 | ТАСС

Ограничения введены в аэропорту Жуковский
13.07.2026 02:47:19 | ТАСС

Легенда уругвайского футбола Диего Форлан возглавил сборную после ухода Бьелсы
13.07.2026 02:45:00 | Life.ru

WP: американские военные обвинили руководство в халатности из-за иранских БПЛА
13.07.2026 02:36:32 | ТАСС

Посол РФ в Осло назвал угрозой участие Норвегии в ядерных миссиях НАТО
13.07.2026 02:33:32 | Life.ru

В авиакатастрофе на Багамах погибли участники группы The Pond Band
13.07.2026 02:31:00 | Российская Газета

Две женщины пострадали при атаке на автобус в ЛНР
13.07.2026 02:30:15 | Коммерсантъ

Мошенники придумали способ обмана родных пропавших без вести участников СВО
13.07.2026 02:28:44 | Lenta.ru

Постпред России предупредил о последствиях ударов по АЭС «Бушер»
13.07.2026 02:25:10 | Lenta.ru

В Сахалинской области в ДТП пострадали пять человек
13.07.2026 02:24:26 | ТАСС

Эксперт Стрельникова: введение в Арктике правового режима Антарктики невозможно
13.07.2026 02:22:47 | ТАСС

Трампа спасли от покушения на саммите НАТО в Турции
13.07.2026 02:22:02 | Life.ru

Politico: Смерть Грэма грозит сорвать новые санкции США против РФ
13.07.2026 02:15:00 | Российская Газета

Politico: Смерть Грэма ставит под вопрос введение американских санкций против РФ
13.07.2026 02:15:00 | Российская Газета

Эксперт Балынин назвал факторы, которые повлияют на рост зарплат в 2027 году
13.07.2026 02:12:49 | ТАСС

Эксперт Юрченко: из-за потепления комары могут чаще распространять инфекции
13.07.2026 02:11:40 | ТАСС

Эксперт Юрченко: потепление может повысить риск инфекций, переносимых комарами
13.07.2026 02:11:40 | ТАСС

Эксперт Арамилев назвал перцовые баллончики малоэффективными против медведей
13.07.2026 02:10:42 | ТАСС

Боец Доллар: ВС РФ удалось подавить украинскую артиллерию у Красного Лимана
13.07.2026 02:05:23 | ТАСС

Мужчина поджег гараж соседа собственным пенисом
13.07.2026 02:01:59 | Lenta.ru

В аэропорту Нижнего Новгорода принимают и выпускают рейсы по согласованию
13.07.2026 02:01:54 | ТАСС

Выявлена скрытая причина повышенного риска болезни Альцгеймера
13.07.2026 02:01:47 | Lenta.ru

Аэропорт Ярославля приостановил прием и выпуск самолетов
13.07.2026 02:01:29 | ТАСС

Россиянам объяснили, как платить за лекарства меньше и не рисковать здоровьем
13.07.2026 02:00:50 | Life.ru

Угон — дело пары минут: как защитить свою машину?
13.07.2026 02:00:00 | За рулем

Дополнительные ограничения введены в аэропорту Краснодара
13.07.2026 01:59:39 | ТАСС

Лабрадора эвакуировали с Бен-Невиса после предполагаемого отравления марихуаной
13.07.2026 01:56:00 | Life.ru

Финляндия построила подземный город из бомбоубежищ с бассейнами и церквями
13.07.2026 01:55:00 | Российская Газета

Появились подробности о диалоге ЕС с Россией по Украине
13.07.2026 01:51:05 | Lenta.ru

Названа предварительная причина смерти сенатора Линдси Грэма*
13.07.2026 01:49:23 | Life.ru

В Турции 30 туристов госпитализировали с жалобами на отравление в отеле
13.07.2026 01:48:58 | РБК

ФБР задействовало все ресурсы для проверки после смерти Грэма
13.07.2026 01:48:11 | ТАСС

Чекунков: кризисы вокруг Суэцкого канала и Ормуза повышают интерес к СМП
13.07.2026 01:47:53 | ТАСС

Число уничтоженных за неделю над Россией украинских БПЛА подсчитали
13.07.2026 01:47:06 | Lenta.ru

В пяти регионах РФ увеличилось потребление алкоголя
13.07.2026 01:47:04 | ТАСС

Все новости

ВСЕ НОВОСТИ

ПИШИТЕ

Техническая поддержка проекта ВсеТут

info@vsetut.pro

Copyright © 2026 - vsetut.pro