GGUF: квантизация с калибровкой (imatrix)

Операция выполнена!

info@vsetut.pro

Стать автором

Вернуться

GGUF: квантизация с калибровкой (imatrix)

06.10.2025 07:58:56 | Хабр

Хабы: Машинное обучение, Искусственный интеллект, Python

Привет, хабровчане!

Признаюсь, я не большой любитель vLLM, Triton Inference Server и всяких там NeMo, вместо них я предпочитаю ollama вообще и llama.cpp в частности, поскольку придерживаюсь мнения, что 1-2% потери в точности и отсутствие некоторых плюшек - не так важно, по сравнению с удобством деплоя, спекулятивным декодингом, многократным приростом скорости, динамическим оффлодом в память системы и возможностью запускать модели на любом "ведре", навроде древних зионов, андройдофонов, малинок или, скажем, макбуков.

Поэтому вполне ожидаемым для меня является, когда авторы моделей заморачиваются с конвертацией оных в GGUF - особом формате сжатия весов моделей, пригодном для запуска через упомянутые выше ollama и llama.cpp.

Однако реальность обычно немного отличается от ожиданий, и конвертацию в GGUF с последующей квантизацией приходится делать самостоятельно, а чтобы качество работы модели не падало, желательно генерировать imatrix через калибровочный датасет, о чём я и хочу рассказать в данной публикации.

Читать далее

Подробнее

Читайте также

Вышла версия Xiaomi 17 с 1 ТБ памяти — продажи уже стартовали в Китае
06.10.2025 07:57:42 | ferra.ru

Джона Тёрнус и его патенты: что разработал будущий CEO Apple
06.10.2025 07:57:38 | Хабр

GSMArena сравнила iPhone 17 Pro Max с 16 Pro Max и рассказала, стоит ли обновляться
06.10.2025 07:50:41 | ferra.ru

Intel расскажет о Panther Lake уже 9 октября, но релиз состоится лишь в 2026 году
06.10.2025 07:43:40 | ferra.ru

Ryzen 7 9800X3D возглавил топ-5 лучших процессоров 2025 года по версии Tom’s Hardware
06.10.2025 07:36:40 | ferra.ru

Не отходя от ноутбука: как ученые создают новые материалы с помощью квантовых моделей
06.10.2025 07:33:43 | Хабр

[Перевод] Python 3.14: ошибки стали понятнее, чем когда-либо
06.10.2025 07:30:42 | Хабр

Apple выпустит первые умные очки уже в 2027 году. Но есть нюанс
06.10.2025 07:29:39 | ferra.ru

WiFi, который не ловил
06.10.2025 07:28:25 | Хабр

В сеть слили подробности о 12 процессорах Intel Panther Lake — от Core Ultra 3 до Ultra 9 X
06.10.2025 07:22:39 | ferra.ru

Анализ реверс-шелла под Linux
06.10.2025 07:21:29 | Хабр

Цены на Core Ultra 5 225F рухнули — на 30% дешевле рекомендаций самой Intel
06.10.2025 07:15:39 | ferra.ru

«Сайты отелей не способны конкурировать с агрегаторами» — миф, который мешает вам расти
06.10.2025 07:11:06 | Хабр

Radeon RX 9070 XT оказался в два раза популярнее, чем RTX 5070 Ti в Австралии
06.10.2025 07:08:38 | ferra.ru

Triton FP8: реализация и автотюнинг GEMM/Attention под RTX 40xx/Blackwell
06.10.2025 07:08:26 | Хабр

Программист embedded лезет в FPGA (часть 3, чего не может ардуинка)
06.10.2025 07:07:09 | Хабр

В Китае испытали робособак, которые заменят луноходы в миссиях на Луне
06.10.2025 07:01:38 | ferra.ru

Воскресная барахолка под Валенсией: винтажная аудиотехника, ноутбуки и много чего еще
06.10.2025 07:00:24 | Хабр

EDA в Python для новичков: что почитать и где попрактиковаться
06.10.2025 07:00:23 | Хабр

Как создать TUI утилиту на GO
06.10.2025 06:55:22 | Хабр

[Перевод] Повторное использование шаблонов элементов и коннекторов для стандартизации процессов
06.10.2025 06:49:38 | Хабр

AI Review кода за 30 минут: локальная LLM прямо в CI/CD
06.10.2025 06:37:18 | Хабр

[Перевод] Создаем иммерсивную трехмерную визуализацию погоды с помощью React Three Fiber
06.10.2025 06:35:27 | Хабр

Дом в облаке, которое твое: запускаем личный сервер на UmbrelOS с полным шифрованием
06.10.2025 06:19:16 | Хабр

От LPT_Print до IaC: Хроника Эволюции Системных Администраторов в России. Наша 25-летняя «Одиссея»
06.10.2025 06:17:29 | Хабр

B2B-платформа для ВЭД: от double-blind маркетплейса до платёжного клиринга
06.10.2025 06:00:13 | Хабр

Kick для QA-инженеров
06.10.2025 06:00:11 | Хабр

Секреты мультиклауд-FinOps: Как не спускать миллионы рублей впустую при использовании нескольких облаков
06.10.2025 05:36:46 | Хабр

Виртуальный гаджет эпохи ИИ-революции
06.10.2025 05:14:05 | Хабр

[Перевод] Понимание оценки LLM: детальный разбор 4 основных подходов
06.10.2025 05:10:03 | Хабр

Шатдаун правительства США, а также Грокипедия от Илона Маска
06.10.2025 05:04:58 | Хабр

Проведено исследование термоядерного синтеза протон–бор, при котором не выделяются нейтроны
06.10.2025 05:04:01 | Хабр

Стоит ли игра свеч? Менее кратко о Single SPA (часть 2)
06.10.2025 04:47:15 | Хабр

Как камеры с ИИ помогают бизнесу
06.10.2025 04:13:15 | Хабр

Как мы сократили отчёты по Jira с 2 часов до 1 клика: Jira Automation to Telegram
06.10.2025 04:10:56 | Хабр

Смотреть все

НОВОСТИ

Названы десять поломок, которые водители готовы починить сами
28.03.2026 14:30:00 | За рулем

Подполковник США заявил, что Вашингтон не сможет поставить Иран «на колени»
08.03.2026 03:41:24 | Life.ru

На 102-м году жизни умерла балерина Нинель Петрова
08.03.2026 03:38:17 | Lenta.ru

Al Jazeera: при ударе по отелю в Бейруте погибли три человека
08.03.2026 03:35:50 | ТАСС

Отель Ramada подвергся атаке в центре Бейрута, три человека погибли
08.03.2026 03:35:37 | Life.ru

В центральной части России прогнозируют половодье
08.03.2026 03:34:04 | ТАСС

Вирусолог Малинникова: появление нового летального патогена не исключается
08.03.2026 03:31:32 | ТАСС

В Подмосковье ищут трех пропавших подростков
08.03.2026 03:28:26 | ТАСС

В столице Болгарии аэропорт прервал работу из-за фотографа-любителя
08.03.2026 03:25:00 | Российская Газета

Назван срок выборов нового верховного лидера Ирана
08.03.2026 03:25:00 | Lenta.ru

Бомбардировщики B-1 США прибыли на военную базу в Англии перед атакой на Иран
08.03.2026 03:23:55 | Life.ru

МВД: мошенники изобрели схему обмана с продажей БАД и выплатой компенсации
08.03.2026 03:18:20 | ТАСС

В Сети появилось фото истребителя Су-35 в «режиме зверя»
08.03.2026 03:17:55 | Life.ru

Индия экстренно предоставила убежище военному кораблю Ирана
08.03.2026 03:16:00 | Lenta.ru

В США указали на ошибку Трампа в Иране
08.03.2026 03:14:40 | Lenta.ru

Reuters: в Бейруте при ударе по отелю погибли два человека
08.03.2026 03:13:38 | ТАСС

Трамп заявил, что в Иране может не остаться тех, кто объявит капитуляцию
08.03.2026 03:10:54 | Life.ru

Ирада Зейналова сообщила, что на Маврикии есть спрос на русский язык
08.03.2026 03:08:14 | ТАСС

Посол Зейналова сообщила, что на Маврикии есть спрос на русский язык
08.03.2026 03:08:14 | ТАСС

Марочко: силы РФ наступают на Славянск и Краматорск фронтом более 40 км
08.03.2026 03:02:43 | ТАСС

Reuters: гостиница в центре Бейрута подверглась удару
08.03.2026 03:02:10 | ТАСС

Время не ждёт: Невролог объяснил, почему раннее движение после инсульта лечит, а покой калечит
08.03.2026 03:00:00 | Life.ru

Депутат Барбашов: кандидаты на Украине будут соревноваться в лояльности Западу
08.03.2026 02:57:10 | ТАСС

Бывшая штаб-квартира ООН в иракской Сулеймании дважды подверглась удару БПЛА
08.03.2026 02:55:59 | Life.ru

На Кубани в результате удара дрона по нефтебазе начался пожар
08.03.2026 02:53:39 | РБК

Основатель «Азова»* формирует преданную армию радикалов на послевоенный период
08.03.2026 02:52:06 | Life.ru

NYT узнала об операции Ирана под названием «Безумец» против США и Израиля
08.03.2026 02:52:04 | РБК

Нанесен удар по портовому терминалу Одессы с ракетами и иностранными военными
08.03.2026 02:51:47 | Lenta.ru

На Камчатке высота нового купола на вулкане Шивелуч достигла 2,4 км
08.03.2026 02:49:03 | ТАСС

В Кувейте сообщили об атаке иранских БПЛА по резервуарам с топливом в аэропорту
08.03.2026 02:46:17 | ТАСС

Беспилотник атаковал отель в Сулеймании, который часто посещают американцы
08.03.2026 02:46:05 | Life.ru

Ответ китайской BYD: в Японии создают полупроводниковую мегакорпорацию за 8,5 млрд долларов
08.03.2026 02:45:00 | iXBT.com

Новое видео GTA Carcer City демонстрирует визуальные улучшения
08.03.2026 02:43:04 | PlayGround.ru

ЦАХАЛ нанесла удар по ракетной установке «Хезболлах», обстреливавшей Израиль
08.03.2026 02:41:22 | Life.ru

Resident Evil Requiem на ПК получила одобрение Digital Foundry, но с некоторыми оговорками
08.03.2026 02:41:15 | PlayGround.ru

Все новости

ВСЕ НОВОСТИ

ПИШИТЕ

Техническая поддержка проекта ВсеТут

info@vsetut.pro

Copyright © 2026 - vsetut.pro