Эффективный инференс множества LoRA адаптеров

info@vsetut.pro

Стать автором

Вернуться

27.06.2025 08:19:39 | Хабр

Хабы: Искусственный интеллект, Машинное обучение, Open source

LoRA — популярный метод дообучения больших моделей на небольших датасетах, однако на этапе инференса низкоранговые адаптеры работают неэффективно, а их объединение с весами требует хранения отдельной полной копии модели для каждого адаптера.

MultiLoRA решает эту проблему, позволяя одновременно выполнять инференс с несколькими адаптерами на основе одной базовой модели.

В статье мы сравним производительность MultiLoRA-инференса в двух популярных фреймворках — vLLM и TensorRT-LLM. Тесты проведём на готовых релизных Docker-образах, оценивая, какой фреймворк эффективнее обрабатывает батчи запросов в сценариях, близких к офлайн и асинхронному инференсу.

Подробнее

Читайте также

Собирали франкенштйена из mdadm, LVM и bcache? Теперь попробуйте ZFS
27.06.2025 08:17:55 | Хабр

У пользователей Xbox Series якобы появилась возможность предзагрузки GTA VI
27.06.2025 08:15:00 | ferra.ru

70 лучших игр по скидкам с летней распродажи в Steam
27.06.2025 07:58:44 | Хабр

Как перевести bluetooth в headset_head_unit на raspberry pi даже если последняя против
27.06.2025 07:53:58 | Хабр

День 1220: Александр Лукашенко про российские машины: «Пока не Mercedes, но хорошие автомобили»
27.06.2025 07:49:52 | vc.ru

Адаптация по-арабски: технологии для печати этикеток товаров
27.06.2025 07:40:44 | Хабр

Прочитал «Чистый код», чтобы вам не пришлось
27.06.2025 07:35:46 | Хабр

Доморощенный OSINT для соискателя. Краткая инструкция
27.06.2025 07:32:40 | Хабр

Песочница от российской компании начала защищать собранные в России Linux-системы
27.06.2025 07:30:00 | ferra.ru

Domain-Driven Design: ошибки, которые не описаны в книгах
27.06.2025 07:28:25 | Хабр

Как мы приручили обратную связь с клиентами через Битрикс24
27.06.2025 07:15:50 | Хабр

[Перевод] В какой момент у младенцев пробуждается сознание?
27.06.2025 07:11:47 | Хабр

Ryzen 5 5500X3D: лучший бюджетный процессор для игровых ПК или старье под AM4?
27.06.2025 07:11:29 | Хабр

Оно живое, и оно растет: новый материал из цианобактерий для связывания углерода
27.06.2025 07:05:31 | Хабр

«Крестный отец» машинного обучения Амари Шуничи получил Премию Киото. Повод вспомнить, что это за ученый
27.06.2025 06:57:04 | Хабр

Треть века в ящике. За что мы всё еще любим электронную почту и почему она будет жить вечно?
27.06.2025 06:49:27 | Хабр

Файлы под контролем: наш путь к эффективной организации данных на примере одного проекта
27.06.2025 06:48:06 | Хабр

Хакеры активизировались сразу после информации об утечке 16 млрд записей
27.06.2025 06:45:00 | ferra.ru

Гонка терабайт: как изменятся объемы SSD-накопителей к 2027 году
27.06.2025 06:41:37 | Хабр

Как ChatGPT удалил в нашем чате 555 спам-сообщений с точностью 98,38%
27.06.2025 06:30:34 | Хабр

Конвейер цифровых сервисов: как создавать и предоставлять услуги без сбоев и стресса
27.06.2025 06:28:07 | Хабр

Как нейросети стали лучшими подружками домохозяек
27.06.2025 06:20:30 | Хабр

Как коммуницировать, чтобы подписать договор на своих условиях?
27.06.2025 06:15:26 | Хабр

Вымогатели подали претензию: F6 обнаружила новые атаки группы Werewolves
27.06.2025 06:06:23 | Хабр

Зелёный чай помог снизить кровяное давление
27.06.2025 06:00:04 | ferra.ru

Защита от DDoS или как нам «впаривают» страх
27.06.2025 05:53:14 | Хабр

Польза для сердца и не только: что будет, если вы станете есть шоколад каждый день
27.06.2025 05:15:33 | ferra.ru

Наводим порядок в загрузке данных Angular с помощью резолверов
27.06.2025 05:15:19 | Хабр

Как я использовал ИИ для создания трейлера книги: опыт без дизайнера
27.06.2025 05:07:06 | Хабр

Врачи объяснили, почему избыток йода вредит здоровью щитовидной железы
27.06.2025 04:30:20 | ferra.ru

Врач призвал не отказываться от глютена из-за риска болезней сердца
27.06.2025 04:03:26 | ferra.ru

Улучшение пищеварения и не только: какую пользу для здоровья несёт ананас
27.06.2025 03:45:34 | ferra.ru

Фасоль и другие продукты, которые помогут поддерживать стабильный уровень сахара в крови
27.06.2025 03:00:58 | ferra.ru

Диетологи перечислили напитки для улучшения здоровья кишечника
27.06.2025 02:15:11 | ferra.ru

Вялость и другие признаки, что ваш метаболизм нуждается в перезагрузке после 50
27.06.2025 01:30:59 | ferra.ru

Смотреть все

НОВОСТИ

Названы десять поломок, которые водители готовы починить сами
28.03.2026 14:30:00 | За рулем

Рада провалила голосование за законопроект о налогах
10.03.2026 15:47:08 | ТАСС

На Урале выявили ядовитые вещества в сбросах воды с целлюлозного завода
10.03.2026 15:46:56 | ТАСС

МЧС предупредило о тонком льде на водоемах Московской области
10.03.2026 15:46:53 | ТАСС

Путин указал на развал системы водоснабжения в "украинский" период Донбасса
10.03.2026 15:45:29 | ТАСС

Церемония прощания с главой КСИР и министром обороны Ирана пройдет 11 марта
10.03.2026 15:45:15 | ТАСС

Консульство срочно обратилось к оставшимся в Израиле россиянам
10.03.2026 15:45:09 | Life.ru

Супруги из Петербурга подали иск к Финляндии, его рассмотрит Верховный суд РФ
10.03.2026 15:45:00 | Российская Газета

Лавров в разговоре с Арагчи высказал позицию в пользу скорой деэскалации ситуации в Иране
10.03.2026 15:44:55 | ТАСС

Уехавший в Израиль Слепаков заявил об обманывающих друг друга людях
10.03.2026 15:44:50 | Lenta.ru

В Тверскую область поступит 22 млрд рублей инвестиций
10.03.2026 15:44:47 | ТАСС

Суд оставил гараж Тимуру Батрутдинову
10.03.2026 15:44:34 | Lenta.ru

В Волгограде появится первый в России музей СВО
10.03.2026 15:44:16 | ТАСС

Синоптик пообещал москвичам потепление до +10 на выходных
10.03.2026 15:44:06 | Life.ru

Пушилин сообщил Путину, что дорогу к Курахову могут построить в этом году
10.03.2026 15:43:58 | ТАСС

АЮР: правкомиссия одобрила упрощение порядка набора присяжных через интернет
10.03.2026 15:43:52 | ТАСС

США предупредили об угрозе терактов из-за войны в Иране
10.03.2026 15:43:43 | Life.ru

Шеф Пентагона высказался о будущем после разговора Путина и Трампа
10.03.2026 15:43:18 | Lenta.ru

КСИР Ирана заявил о 34-й волне ракетных ударов по военным база США и Израиля
10.03.2026 15:42:08 | ТАСС

Популярная диета оказалась связана со снижением риска переломов костей
10.03.2026 15:42:01 | Lenta.ru

Курс юаня на Мосбирже поднялся выше 11,5 рубля впервые с 19 декабря 2025 года
10.03.2026 15:41:45 | ТАСС

Saudi Aramco: закрытие Ормузского пролива ведет к катастрофе в мировой экономике
10.03.2026 15:40:38 | ТАСС

«Мы движемся к столкновению». На какую страну вслед за Ираном может нацелиться Израиль и помогут ли ему США?
10.03.2026 15:39:44 | Lenta.ru

Дождь пошел в салоне автобуса и возмутил россиян
10.03.2026 15:39:25 | Lenta.ru

Экс-замглавы департамента Самары осудили за мошенничество с жилфондом
10.03.2026 15:39:21 | ТАСС

Шеф Пентагона послал больше истребителей к Ирану для «самых мощных» ударов
10.03.2026 15:39:04 | Life.ru

Соцфонд предупредил об отказах при упущении буквы "ё" в заявлении на единое пособие
10.03.2026 15:38:58 | ТАСС

Судье Скугареву пожизненно запретили заниматься любой хоккейной деятельностью
10.03.2026 15:38:28 | ТАСС

Китай и КНДР впервые за шесть лет возобновили пассажирское ж/д сообщение
10.03.2026 15:38:00 | Российская Газета

Сальдо: ВСУ массированно атакуют дронами Херсонскую область
10.03.2026 15:37:38 | Life.ru

Эксперт Лебедев: Франция не сможет раскрыть ядерный зонтик над Европой
10.03.2026 15:37:18 | ТАСС

Дзюба назвал игру «Зенита» безобразной
10.03.2026 15:37:15 | Lenta.ru

Путин раскрыл процент контролируемых Украиной территорий в ДНР
10.03.2026 15:36:25 | Lenta.ru

Путин назвал жителей Донбасса настоящими подвижниками
10.03.2026 15:36:12 | ТАСС

Трамп прокомментировал избрание Моджтабы Хаменеи верховным лидером Ирана
10.03.2026 15:36:00 | Российская Газета

Все новости

ВСЕ НОВОСТИ

ПИШИТЕ

Техническая поддержка проекта ВсеТут

info@vsetut.pro