Как сжимать языковые модели без дообучения

Операция выполнена!

info@vsetut.pro

Стать автором

Вернуться

Как сжимать языковые модели без дообучения

02.12.2025 13:00:26 | Хабр

Хабы: Блог компании МТС, Блог компании MWS AI, Искусственный интеллект, Машинное обучение, Научно-популярное

Привет, Хабр! Меня зовут Валентин Малых, я - и.о. руководителя направления фундаментальных исследований в MWS AI. Сегодня я расскажу об одном нашем исследовании по сжатию LLM. Если простыми словами, то это про то, как сделать большую модель чуть-чуть менее требовательной в плане памяти и времени выполнения. Для это придумано три базовых техники: квантизация (загрубление весов модели), дистилляция (обучение уменьшенной копии) и прунинг (удаление части сети). Этот пост как раз будет про третий способ, точнее – недавно разработанный нами в сотрудничестве с зарубежными коллегами метод структурного прунинга по глубине без дообучения, который мы назвали ReplaceMe. Например, модель LLaMA-2 после нашего сжатия на 25% сохраняет 92,5% качества. Ниже – о том, как это работает.

Читать далее

Подробнее

Читайте также

Microsoft вернулась к выпуску «уродливых» рождественских свитеров после перерыва в 2024 году
02.12.2025 12:52:12 | vc.ru

Тестирование без тонны кейсов: свобода, автотесты и наша экспертиза
02.12.2025 12:48:18 | Хабр

Пекин и не только: названы города с самым большим количеством камер видеонаблюдения
02.12.2025 12:45:59 | ferra.ru

Kprobes и где они обитают
02.12.2025 12:45:36 | Хабр

LLM Observability & AI Agent Tracing: большой гайд с обзором подходов и open-source решений
02.12.2025 12:42:29 | Хабр

Критерии выбора CRM
02.12.2025 12:41:20 | Хабр

Не просто «пилил фичи»: как рассказать о проекте, чтобы получить +1 к грейду
02.12.2025 12:28:38 | Хабр

Барьеры, которые рухнули: как искусство училось быть доступным для всех — истории, факты, кейсы
02.12.2025 12:21:43 | Хабр

«Яндекс Маркет» начал тестировать новую модель работы со сниженными тарифами для продавцов и ограничением собственных скидок
02.12.2025 12:17:59 | vc.ru

Почему российские производители не закупают отечественные печатные платы?
02.12.2025 12:14:34 | it-world

Отражающий Kerberos
02.12.2025 12:09:21 | Хабр

Ученые МГУ улучшили ИИ для диагностики туберкулеза по снимкам
02.12.2025 12:04:07 | ferra.ru

Apple не будет соблюдать требование властей Индии о предустановке государственного приложения — Reuters
02.12.2025 12:03:07 | vc.ru

Учёные обнаружили, что лечение зубов помогает контролировать уровень сахара в крови
02.12.2025 12:00:31 | ferra.ru

[Перевод] Как написать хороший CLAUDE.md, чтобы не было мучительно больно
02.12.2025 11:59:40 | Хабр

Запрет Roblox, успехи Of Ash and Steel и релиз новой игры Сергея Носкова: новости игропрома за 17–30 ноября 2025
02.12.2025 11:59:08 | Хабр

Как написать свой MCP сервер на языке R
02.12.2025 11:58:48 | Хабр

Ultimate System Design Checklist
02.12.2025 11:56:57 | Хабр

Названы факторы, которые делают планету пригодной для жизни
02.12.2025 11:15:40 | ferra.ru

Samsung представила складной смартфон с тройным экраном Galaxy Z TriFold
02.12.2025 11:00:48 | vc.ru

Про традиционные проблемы в найме: несогласованность приоритетов
02.12.2025 11:00:30 | Хабр

От хаоса к структуре: как FEOD помогает упорядочить архитектуру фронтенд-приложений
02.12.2025 11:00:11 | Хабр

Как прошёл Golang Meetup Wildberries & Russ
02.12.2025 10:54:48 | Хабр

Платежные карты Wise заблокировали для россиян и белорусов
02.12.2025 10:53:27 | it-world

Грани полиморфизма React: полиморфные декораторы
02.12.2025 10:49:09 | Хабр

Управляем «протягиванием» прокрутки: разбор overscroll‑behavior
02.12.2025 10:36:31 | Хабр

Играемся с формами M3 Expressive в Android приложении на View
02.12.2025 10:32:41 | Хабр

Доказано: люди и ИИ учатся похожим образом
02.12.2025 10:30:19 | ferra.ru

Разрабатываю MCP интеграции к платформе AI агентов — ключевые моменты
02.12.2025 10:21:45 | Хабр

Почему все ноутбуки стали одинаковыми, или Как MacBook повлиял на дизайн лэптопов
02.12.2025 10:13:10 | Хабр

Контроль импеданса
02.12.2025 10:09:55 | Хабр

Hyper-V: последняя крепость Microsoft в инфраструктурной войне
02.12.2025 10:01:01 | Хабр

Финальная точка или новая глава истории: Intel сегодня
02.12.2025 09:48:43 | Хабр

Крупные российские аккредитованные ИТ-компании должны будут отчислять 3% от «сэкономленных» налогов на поддержку вузов
02.12.2025 09:46:19 | vc.ru

10 Chrome-расширений для QA часть 2
02.12.2025 09:45:59 | Хабр

Смотреть все

НОВОСТИ

Названы десять поломок, которые водители готовы починить сами
28.03.2026 14:30:00 | За рулем

Индекс фондовой биржи Лондона упал почти на 3% на фоне атаки на Иран
03.03.2026 20:53:48 | ТАСС

Мужчина ворвался в прямой эфир телеканала и спустил штаны
03.03.2026 20:53:36 | Lenta.ru

Балет "Кострома" выступил в Нью-Дели
03.03.2026 20:52:31 | ТАСС

Страны Европы стараются вывезти своих граждан с Ближнего Востока
03.03.2026 20:51:00 | Российская Газета

Генштаб ЦАХАЛ заявил, что операцию в Ливане будут вести до полного разоружения "Хезболлах"
03.03.2026 20:50:38 | ТАСС

У Александра Кибовского изъяты активы на миллиарды рублей
03.03.2026 20:50:24 | Коммерсантъ

КСИР: число погибших иранцев от ударов США и Израиля возросло до 700
03.03.2026 20:49:33 | ТАСС

В Тунисе суд приговорил богатейшего бизнесмена Марвана Мабрука к 20 годам тюрьмы
03.03.2026 20:49:00 | Российская Газета

Глава МИД Омана призвал стороны конфликта в регионе вернуться к переговорам
03.03.2026 20:47:48 | ТАСС

На помощь российским туристам на Ближнем Востоке ушли миллиарды рублей
03.03.2026 20:47:18 | Lenta.ru

17-летнюю дочь Николь Кидман высмеяли в сети за нелепую походку на модном показе
03.03.2026 20:47:05 | Lenta.ru

Трамп утверждает, что у Ирана заканчиваются ракетные установки
03.03.2026 20:46:57 | ТАСС

Трамп допустил ужесточение торговых соглашений с другими странами
03.03.2026 20:46:00 | Lenta.ru

В Минобороны Ирана заявили, что США и Израиль скоро прекратят войну
03.03.2026 20:45:17 | Life.ru

Зубрицкий заявил об отсутствии проблем с коммуникацией на борту МКС
03.03.2026 20:44:00 | ТАСС

Ольга Картункова впервые стала бабушкой
03.03.2026 20:43:15 | Life.ru

Трамп: США разорвут торговые отношения с Испанией
03.03.2026 20:43:00 | Российская Газета

Трамп: США несли крупные убытки из-за Китая, но это уже не так
03.03.2026 20:42:51 | ТАСС

Дегтярев рассматривает заявление МОК как сигнал к снятию санкций с россиян
03.03.2026 20:42:46 | ТАСС

Путин разрешил "Нова капиталу" купить до 40% "Эльгаугля"
03.03.2026 20:39:01 | ТАСС

Мерц солидарен со стремлением США покончить с руководством Ирана
03.03.2026 20:38:40 | ТАСС

Путешествия для россиян стали еще дороже из-за конфликта на Ближнем Востоке
03.03.2026 20:37:57 | Lenta.ru

Сын Алибасова задолжал налоговой более 1,8 миллиона рублей
03.03.2026 20:37:50 | Lenta.ru

Обратно в Дубай: жители возвращаются в мегаполис на фоне ударов по северу ОАЭ
03.03.2026 20:37:46 | ТАСС

В Липецкой области мужчина напал на бригаду скорой
03.03.2026 20:36:01 | ТАСС

МИД РФ призвал не ездить в страны Персидского залива до конца боевых действий
03.03.2026 20:35:08 | Life.ru

Серия взрывов сотрясла столицы и некоторые города ОАЭ, Катара и Кувейта
03.03.2026 20:34:00 | Российская Газета

ТАСС: у границы ОАЭ во время взрывов в Дубае и Абу-Даби кружили семь самолетов
03.03.2026 20:33:26 | ТАСС

Названа продолжительность здорового сна
03.03.2026 20:32:28 | Lenta.ru

Трамп выразил недовольство одним союзником в конфликте с Ираном
03.03.2026 20:32:11 | Lenta.ru

Трамп определил приоритетность Украины для США
03.03.2026 20:32:00 | Lenta.ru

Трамп: США не удовлетворены подходами Британии к обороне и операции против Ирана
03.03.2026 20:31:18 | ТАСС

Al Jazeera: в Эрбиле произошли несколько мощных взрывов
03.03.2026 20:29:13 | ТАСС

РПЦ не вовлекает африканцев в военные действия, заявил "РГ" экзарх Африки
03.03.2026 20:29:00 | Российская Газета

Все новости

ВСЕ НОВОСТИ

ПИШИТЕ

Техническая поддержка проекта ВсеТут

info@vsetut.pro

Copyright © 2026 - vsetut.pro