Операция выполнена!

info@vsetut.pro

Стать автором

Вернуться

[Перевод] Дезагрегированный инференс LLM в Kubernetes: префилл, декодирование и планирование подов

27.05.2026 12:09:08 | Хабр

Хабы: Блог компании VK Tech, Машинное обучение, IT-инфраструктура, Облачные вычисления, Kubernetes

С ростом сложности рабочих нагрузок инференса больших языковых моделей (LLM) единый монолитный процесс обслуживания упирается в свои пределы. У префилла и декодирования принципиально разные профили вычислений, но традиционные развёртывания заставляют их работать на одном оборудовании. В итоге GPU недозагружены, а масштабирование — негибкое.

Дезагрегированный инференс решает эту проблему: разбивает конвейер на отдельные этапы — префилл, декодирование и маршрутизацию. Каждый этап работает как независимый сервис, который можно обеспечивать ресурсами и масштабировать на собственных условиях.

Команда VK Cloud перевела статью, в которой разбирается, как развернуть дезагрегированный инференс в Kubernetes. Здесь мы посмотрим на разные решения экосистемы, как они работают в кластере и что дают «из коробки».

Читать далее

Подробнее

Читайте также

Как стать Go-разработчиком с нуля? Бесплатная программа обучения
27.05.2026 12:00:52 | Хабр

Разработка эмулятора NES на отечественном микроконтроллере К1921ВГ1Т
27.05.2026 11:41:00 | Хабр

predict_proba выдаёт 0.9 — но это не вероятность 90%
27.05.2026 11:40:50 | Хабр

OneClickRelease, или как мы ставим релизы одной кнопкой
27.05.2026 11:36:10 | Хабр

Ускорение INSERT/COPY в логической репликации PostgreSQL
27.05.2026 11:34:15 | Хабр

Полиморфные ссылки в PostgreSQL: три попытки помочь оптимизатору
27.05.2026 11:32:39 | Хабр

Слух: Huawei Nova 16 Ultra получит главную камеру с 200 Мп
27.05.2026 11:29:49 | ferra.ru

Выбираем роутер стандарта Wi-Fi 7
27.05.2026 11:21:25 | it-world

Ransomware: математический аппарат на службе зла
27.05.2026 11:20:36 | Хабр

Блеск и нищета SMM hh.ru
27.05.2026 11:16:00 | Хабр

Пишем универсальную глитч-машину
27.05.2026 11:07:19 | Хабр

Члены крупнейшего профсоюза Samsung поддержали соглашение о компенсациях — средний бонус для сотрудников составит около $340 тысяч
27.05.2026 11:00:06 | vc.ru

Как не похоронить бизнес на старте: анатомия корпоративных конфликтов при учреждении ООО
27.05.2026 10:59:05 | Хабр

Как стиль общения может создавать карьерный тупик в ИТ
27.05.2026 10:52:51 | Хабр

Ответы с «деврел‑супервизии», вопрос восьмой: как держать веру команды и ЛПР, когда метрики шатаются
27.05.2026 10:50:22 | Хабр

Новинка: Прикладные API для искусственного интеллекта и Data Science
27.05.2026 10:35:01 | Хабр

Миграция с ingress-nginx: выбор нового контроллера
27.05.2026 10:30:41 | Хабр

Ожидание: сделать ИИ-примерочную обоев за 2 дня. Реальность: пришлось добучать свою модель на SD
27.05.2026 10:24:21 | Хабр

«Яндекс» запустил комбинированную доставку — робот везёт заказ до подъезда, а курьер поднимает до двери
27.05.2026 10:16:23 | vc.ru

Как мы тестируем в Профи.ру: почему у нас нет пирамиды, зато есть ромб и матрица
27.05.2026 10:10:38 | Хабр

Об Open-source — спасителе человечества и kernel-сообществе пророке его…
27.05.2026 10:03:24 | Хабр

ТОП-10 сайтов мебельных магазинов: лучшие UX-решения и приемы юзабилити
27.05.2026 09:59:47 | Хабр

QSEAL: новый подход в резервном копировании средствами СХД
27.05.2026 09:53:16 | Хабр

Книга: «Windows Server 2022. Полное руководство по администрированию»
27.05.2026 09:49:44 | Хабр

Минцифры расширило набор данных, которые операторы должны передавать «уполномоченным органам» через СОРМ
27.05.2026 09:42:38 | vc.ru

Нейросети для работы с Excel: Выбираем ИИ для создания таблиц и написания формул
27.05.2026 09:42:02 | Хабр

Совместимость Test IT и RedOS: опыт автоматизации сборки, тестирования и сертификации
27.05.2026 09:38:43 | Хабр

RAG-Anything: Как собрать по-настоящему мультимодальный RAG
27.05.2026 09:33:50 | Хабр

OLED Samsung, дизайн Джони Айва: Ferrari показала свой первый электрокар Luce
27.05.2026 09:29:47 | ferra.ru

Как я готовился к Certified Kubernetes Security Specialist (CKS) в 2026 году
27.05.2026 09:29:15 | Хабр

Вы ведёте дела как в 90-е? Короткий тест подсветит типичные просчёты
27.05.2026 09:22:06 | ferra.ru

Я держал кафе 16 лет и кормил полгорода. Потом пришли зумеры и всё посыпалось
27.05.2026 09:13:24 | Хабр

Есть ли жизнь на фазе: откуда берёт энергию умный выключатель без подключённой нейтрали
27.05.2026 09:09:29 | Хабр

Go Computer. История удивительного планшета из 1992 года с графическим интерфейсом
27.05.2026 09:01:29 | Хабр

Экономия GPU-часов в 2,5 раза, уход ИИ в бэкенд и новые стандарты агентских систем: ML-дайджест
27.05.2026 09:00:29 | Хабр

Смотреть все

НОВОСТИ

Трамп подтвердил, что Уиткофф и Кушнер скоро впервые посетят Украину
31.07.2026 05:12:00 | Life.ru

Синоптик Кубай объяснил, чем Приморью грозит "инкубатор тайфунов"
31.07.2026 05:09:28 | ТАСС

В Приамурье ввели запрет на использование воздушных судов малой авиации
31.07.2026 05:07:02 | ТАСС

Бойцы ВС РФ "Ланцетом" уничтожили украинскую РСЗО с расстояния более 20 км
31.07.2026 05:06:24 | ТАСС

В Казани и еще девяти городах Татарстана объявили угрозу БПЛА
31.07.2026 05:06:19 | ТАСС

В природном парке "Быстринский" на Камчатке открылись летние маршруты
31.07.2026 05:06:05 | ТАСС

Бойцы "Запада" сбили 3 БПЛА "Лютый" из зенитной установки ЗУ-23, установленной на "Камаз"
31.07.2026 05:05:37 | ТАСС

Операторы ударных дронов уничтожили укрепрайон ВСУ на добропольском направлении
31.07.2026 05:05:02 | ТАСС

Бойцы "Востока" уничтожили диверсионно-разведывательную группу ВСУ на Запорожье
31.07.2026 05:04:54 | ТАСС

В Торском медики "Центра" помогли тяжелораненому солдату ВСУ
31.07.2026 05:04:37 | ТАСС

Командир Кавказ: бойцы "Центра" обманули ВСУ в Торском, переждав атаку дронов
31.07.2026 05:04:07 | ТАСС

В аэропорту Калуги сняли ограничения на прием и выпуск самолетов
31.07.2026 05:04:03 | ТАСС

Миронов предложил увеличить пенсии детям, потерявшим родителей
31.07.2026 05:04:02 | ТАСС

ВСУ выдали расположение пунктов управления БПЛА, забрав приземлившиеся дроны
31.07.2026 05:03:50 | ТАСС

Саперы системы "Земледелие" сорвали ротацию ВСУ на добропольском направлении
31.07.2026 05:03:33 | ТАСС

Расчет ЗРК "Бук-М3" отразил воздушную атаку ВСУ на добропольском направлении
31.07.2026 05:03:07 | ТАСС

В отелях Петербурга средняя стоимость номера выросла на 8%
31.07.2026 05:02:58 | ТАСС

Бойцы "Востока" уничтожили 15 укрепленных блиндажей ВСУ в Запорожской области
31.07.2026 05:02:54 | ТАСС

Командир Клементьев: маршрут захода в Торское штурмовикам РФ прокладывать с дрона
31.07.2026 05:02:46 | ТАСС

Командир Борзый: ВСУ в Торском пробивали сквозные дыры в домах для оборудования бойниц
31.07.2026 05:02:04 | ТАСС

Командир Борзый рассказал, как начался штурм Торского
31.07.2026 05:01:54 | ТАСС

Малый морской танкер "Валентин Рыков" принят в состав Балтийского флота
31.07.2026 05:01:50 | ТАСС

ВСУ потеряли за сутки от действий "Севера" 205 беспилотников самолетного типа
31.07.2026 05:01:44 | ТАСС

Эксперт Киселев: Киев не дает людям эвакуироваться из Константиновки
31.07.2026 05:01:38 | ТАСС

ВСУ потеряли за сутки от действий "Запада" 103 тяжелых квадрокоптера
31.07.2026 05:01:20 | ТАСС

Командир Кавказ: при зачистке Торского ВС РФ пробивали ходы под землей
31.07.2026 05:01:13 | ТАСС

Мирошник сообщил, что Зеленского уже пытались отстранить от денежных потоков
31.07.2026 05:00:55 | ТАСС

Эксклюзивную машину легенды НБА нашли на авторазборке после ДТП
31.07.2026 05:00:42 | Lenta.ru

Женщинам дали касающийся анального секса важный совет
31.07.2026 05:00:27 | Lenta.ru

Прививка раз в 10 лет может спасти жизнь: Что важно знать каждому дачнику
31.07.2026 05:00:00 | Life.ru

Польский депутат возмутился реакцией властей после ЧП на границе с Украиной
31.07.2026 04:59:48 | Lenta.ru

Предприятие ТЭК в Волгограде загорелось при ударе БПЛА
31.07.2026 04:59:13 | Коммерсантъ

На Сахалине нашли пропавшую 62-летнюю женщину
31.07.2026 04:50:54 | ТАСС

Пять человек пострадали при атаке беспилотников в Волгоградской области
31.07.2026 04:50:38 | РБК

Пять человек пострадали при атаке украинских БПЛА на Волгоградскую область
31.07.2026 04:50:29 | Life.ru

Все новости

ВСЕ НОВОСТИ

ПИШИТЕ

Техническая поддержка проекта ВсеТут

info@vsetut.pro

Copyright © 2026 - vsetut.pro