[Перевод] Внутри vLLM: Анатомия системы инференса LLM с высокой пропускной способностью

Операция выполнена!

info@vsetut.pro

Стать автором

Вернуться

[Перевод] Внутри vLLM: Анатомия системы инференса LLM с высокой пропускной способностью

18.10.2025 19:53:59 | Хабр

Хабы: Искусственный интеллект, Машинное обучение, Big Data, Анализ и проектирование систем

Привет! Этот пост — перевод очень хардовой статьи про внутренности vLLM и того, как устроен инференс LLM. Переводить было сложно из-за англицизмов и отсутствия устоявшегося перевода многих терминов, но это слишком классная статья, и она обязана быть на русском языке! А дальше — слово автору:

От paged attention, непрерывного батчинга, кэширования префиксов , specdec и т.д. — до мульти-GPU и мультинодового динамического сервинга LLM под нагрузкой.

В этом посте я постепенно представлю все основные системные компоненты и продвинутые функции, которые составляют современную систему инференса LLM с высокой пропускной способностью. И детально разберу, как внутри работает vLLM.

Читать далее

Подробнее

Читайте также

Академ ради инди ИИ-продуктов. В 19 лет пожертвовал кругом общения и теперь ищу таких же одержимых
18.10.2025 19:31:42 | Хабр

Найдены новые растительные ингредиенты с эффектом против старения
18.10.2025 19:30:40 | ferra.ru

[Перевод] Встречайте OpenTSLM: семейство моделей языка временных рядов (TSLM), для анализа медицинских временных рядов
18.10.2025 19:27:55 | Хабр

Uber позволил водителям зарабатывать на обучении ИИ
18.10.2025 18:45:38 | ferra.ru

Космическая тяга: что есть и что будет?
18.10.2025 18:27:06 | Хабр

В США предложили создать бургер с 50% говядины и 50% растительных компонентов
18.10.2025 18:00:36 | ferra.ru

Решение для автоматизированной установки сетевых принтеров в гетерогенной среде
18.10.2025 17:58:14 | Хабр

Копим на пенсию в открытом коде
18.10.2025 17:40:01 | Хабр

RedMagic 11 Pro распаковали… под водой
18.10.2025 17:15:35 | ferra.ru

Разработка MCP-сервера на примере CRUD операций
18.10.2025 16:41:48 | Хабр

Сотрудники Turing Labs носили на голове GoPro, чтобы обучать ИИ
18.10.2025 16:30:33 | ferra.ru

Tesla вернула превышающий скорость режим Mad Max в свой автопилот
18.10.2025 15:45:31 | ferra.ru

Категории типов. Часть 4. Монады
18.10.2025 15:17:39 | Хабр

Фишки Telegram
18.10.2025 15:16:58 | Хабр

Собрана квантовая антенна, что ловит радиосигналы с помощью света и атомов
18.10.2025 15:00:28 | ferra.ru

Новая имба Blender 5.0: ACES/Rec.2020. Сравнение на примерах
18.10.2025 14:41:58 | Хабр

ИИ Google Gemini научили лучше работать с таблицами вместо вас
18.10.2025 14:15:26 | ferra.ru

«Дворовый фейсбук»: как Cybiko сделала уникальный КПК-социальную сеть в 2000 году
18.10.2025 14:05:48 | Хабр

Cybiko: социальный КПК с Mesh-сетью из 2000 года
18.10.2025 14:05:48 | Хабр

Удивительно, но новая функция Google Photos доступна не по всей территории США
18.10.2025 13:30:24 | ferra.ru

День 1333: правительство выделило дополнительно 4,5 млрд рублей на программу льготного кредитования в сфере туризма
18.10.2025 13:16:24 | vc.ru

Почему файлы стали меньше: форматы фото и видео (JPEG, HEIC, AV1)
18.10.2025 13:01:38 | Хабр

Учёные: подзаряжаемые гибриды загрязняют воздух сильнее, чем считалось раньше
18.10.2025 12:45:22 | ferra.ru

[Перевод] Создал расширение для Chrome и устранил шахматных читеров
18.10.2025 12:00:29 | Хабр

[Перевод] Придумал расширение для Chrome и устранил шахматных читеров
18.10.2025 12:00:29 | Хабр

Anthropic представила набор «умений», делающих ИИ-агентов умнее и полезнее
18.10.2025 12:00:21 | ferra.ru

Chainalysis назвала Россию лидером среди европейских стран по использованию криптовалют
18.10.2025 11:40:27 | vc.ru

Ещё одна отладочная плата и тесты К1921ВГ015
18.10.2025 11:16:22 | Хабр

SpaceX запустила 21 спутник связи для новой военной сети США
18.10.2025 11:15:14 | ferra.ru

Гранатовый сок поможет вам снизить давление
18.10.2025 10:30:12 | ferra.ru

Kafka для начинающих: откуда такой спрос и зачем нужна эта технология
18.10.2025 10:16:18 | Хабр

Числовой тип данных с плавающей точкой float IEEE 754
18.10.2025 10:15:12 | Хабр

10 систем управления проектами с AI: проверила, где искусственный интеллект работает лучше менеджеров
18.10.2025 09:53:06 | Хабр

10 систем управления проектами с AI: проверила, где искусственный интеллект работает без менеджеров
18.10.2025 09:53:06 | Хабр

Учёные обнаружили, что наши психические болезни — результат развитого интеллекта
18.10.2025 09:45:32 | ferra.ru

Смотреть все

НОВОСТИ

Названы десять поломок, которые водители готовы починить сами
28.03.2026 14:30:00 | За рулем

Военный эксперт Рамм: "Эпическая ярость" развалилась из-за эффекта домино
10.03.2026 23:04:00 | Российская Газета

Reuters: В ходе операции против Ирана ранения получили около 150 военных США
10.03.2026 23:00:43 | Life.ru

Командир отряда «Родня» Евгений Николаев погиб в зоне военной операции
10.03.2026 22:57:27 | РБК

Трамп пригрозил Ирану невиданными ответом из-за мин в Ормузском проливе
10.03.2026 22:57:14 | РБК

Генконсульство РФ в Исфахане пострадало при ударах по Ирану
10.03.2026 22:57:00 | Российская Газета

14 «новичков» из России в рейтинге миллиардеров Forbes. Фотогалерея
10.03.2026 22:54:14 | РБК

Вышедший из тюрьмы мужчина насмерть забил подростка молотком и выпил его кровь
10.03.2026 22:53:46 | Lenta.ru

Нетаньяху объявил о намерении выделить миллиарды долларов на нужды военных действий
10.03.2026 22:52:25 | ТАСС

Трамп признал, что США не имеют данных о минировании Ормузского пролива Ираном
10.03.2026 22:51:40 | ТАСС

Главу округа Тверской области Титова отстранили от должности из-за задержания
10.03.2026 22:50:36 | ТАСС

Главы МИД РФ и Саудовской Аравии призвали прекратить удары на Ближнем Востоке
10.03.2026 22:50:05 | Life.ru

В Германии возмутились вручением Зеленскому главной награды ЕC
10.03.2026 22:50:00 | Lenta.ru

Китай обсудил с Maersk и MCS угрозу сбоя поставок товаров морским путем
10.03.2026 22:48:27 | РБК

В Дагестане ребенок погиб из-за самовольно установленного водонагревателя
10.03.2026 22:47:56 | ТАСС

Зеленского наградили главным орденом Евросоюза
10.03.2026 22:47:06 | Lenta.ru

КСИР: силы ПВО Ирана с начала эскалации конфликта с США и Израилем сбили 104 БПЛА
10.03.2026 22:47:02 | ТАСС

Пезешкиан рассказал Путину об ударах США и Израиля по инфраструктуре
10.03.2026 22:44:34 | РБК

INA завершила проект модернизации НПЗ на Адриатике стоимостью €700 млн
10.03.2026 22:44:21 | ТАСС

Минюст Молдавии оспорил полномочия руководства Гагаузии в Конституционном суде
10.03.2026 22:43:50 | ТАСС

Во Владикавказе 16 молодых семей получили жилищные сертификаты
10.03.2026 22:43:42 | ТАСС

В Москву прибыл второй за десять суток пассажирский самолет из Катара
10.03.2026 22:43:15 | ТАСС

Религиозный лидер Нигерии обвинил США в планах свержения президентов в Африке
10.03.2026 22:42:23 | ТАСС

"Галатасарай" обыграл "Ливерпуль" в первом матче 1/8 финала Лиги чемпионов
10.03.2026 22:41:15 | ТАСС

Захарова: Генконсульство РФ в Исфахане повредили при ударе по администрации
10.03.2026 22:40:10 | Life.ru

«Галатасарай» обыграл «Ливерпуль» в первом матче 1/8 финала Лиги чемпионов
10.03.2026 22:40:00 | Lenta.ru

Nvidia готовит собственный ответ OpenClaw — платформу NemoClaw для агентных ИИ
10.03.2026 22:39:00 | iXBT.com

На план энергостойкости Киева потребуется свыше $1,3 млрд
10.03.2026 22:38:35 | ТАСС

В Северной Осетии на жилье для детей-сирот направят 200 млн рублей
10.03.2026 22:38:25 | ТАСС

В России назвали главных виновных в ударе по Брянску
10.03.2026 22:37:12 | Lenta.ru

Аракчи: Фейковые новостные вбросы не спасут США от экономического цунами
10.03.2026 22:36:00 | Российская Газета

Предположительно, погибшим в Карелии лыжником был музыкант Петр Гайдуков
10.03.2026 22:34:46 | ТАСС

Погибшим в Карелии лыжником мог быть музыкант Петр Гайдуков
10.03.2026 22:34:46 | ТАСС

В Карелии погиб дирижер Петр Гайдуков, снявшийся в клипе Shortparis
10.03.2026 22:33:43 | РБК

ВСУ ударили БПЛА по территории ЛНР семь раз за сутки
10.03.2026 22:33:00 | ТАСС

Все новости

ВСЕ НОВОСТИ

ПИШИТЕ

Техническая поддержка проекта ВсеТут

info@vsetut.pro

Copyright © 2026 - vsetut.pro