Как готовить Triton: рецепты вашей собственной Inference-платформы

info@vsetut.pro

Стать автором

Вернуться

17.04.2025 12:03:45 | Хабр

Хабы: Блог компании Selectel, DevOps, IT-инфраструктура, Высокая производительность, Машинное обучение

Привет, Хабр! Меня зовут Антон, я DevOps-инженер в команде Data/ML-продуктов Selectel. Если вам нужно запустить небольшой инференс одной ML-модели, можно взять команду бэкендеров, дать им эту модель, они обернут ее в эндпоинт — и готово. Достаточно короткого скрипта из нескольких строк на Python. Но что если нужно запускать несколько моделей, оптимизировать выполнение, работать с ансамблем моделей, задействовать CPU и GPU одновременно и т. д.? Все эти проблемы решает NVIDIA Triton Inference Server. Правда, он добавляет одну новую: разобраться с ним и его документацией — тот еще квест.

В статье посмотрим, насколько сложной задачей может оказаться создание собственного инференса и какие аспекты нужно учитывать. Научимся запускать различные форматы моделей, посмотрим на основные фичи Inference-платформы Selectel, запустим несколько популярных LLM и моделей, а также познакомимся со способами оптимизации конфигурации и проектирования интерфейса для модели. Читать дальше →

Подробнее

Читайте также

Почему малый бизнес хочет окупаемость рекламы и умирает, а крупный бизнес тратит миллионы на brand search и растет
17.04.2025 12:02:14 | Хабр

General Purpose Media Interface (GPMI): китайский ответ HDMI и DisplayPort. Что это за технология?
17.04.2025 12:00:46 | Хабр

Цукерберг предвидел антимонопольный иск против Meta* ещё в 2018 году
17.04.2025 12:00:02 | ferra.ru

Яндекс завершил сделку по покупке платформы для облачного гейминга
17.04.2025 11:38:23 | ferra.ru

PM — Как фильтр для команды
17.04.2025 11:31:34 | Хабр

Инструмент стресс-тестирования OCCT теперь доступен для Linux
17.04.2025 11:29:56 | it-world

Минусы и плюсы онлайн школы по программированию для школьников: объективный обзор и неочевидные детали
17.04.2025 11:26:09 | Хабр

[Перевод] Обзор CUDA: сюрпризы с производительностью
17.04.2025 11:25:58 | Хабр

Можно ли реализовать обучение онлайн детей 7 лет на курсах программирования?
17.04.2025 11:15:31 | Хабр

Atomic Keyboard анонсировала ретро-клавиатуру без клавиши Escape
17.04.2025 11:15:01 | ferra.ru

Уральские ученые нашли генетическую связь с ощущением благополучия
17.04.2025 11:03:12 | ferra.ru

Пробуем Codex CLI для доработки ХрюХрюКара
17.04.2025 10:58:09 | Хабр

Книга: «Создание фронтенд-фреймворка с нуля»
17.04.2025 10:54:20 | Хабр

100 % cover, 0 % спокойствия
17.04.2025 10:52:00 | Хабр

Когда вам стоит обратиться к ИТ-юристу? (Возможно, сейчас!)
17.04.2025 10:46:26 | Хабр

Иннополис и СПбПУ откроют лабораторию по новым материалам для робототехники
17.04.2025 10:45:35 | ferra.ru

На 17 апреля анонсирован выход тестовой версии Android 16 Beta 4
17.04.2025 10:37:20 | ferra.ru

Стартапу Telli дали $3,6 млн на развитие ИИ-автоответчиков
17.04.2025 10:30:59 | ferra.ru

Ускорить Pandas в 60 раз: проверяем лайфхаки из интернета на реальном проекте и обкладываемся бенчмарками
17.04.2025 10:25:57 | Хабр

«Киберспортивный флагман» HONOR GT Pro побил рекорд AnTuTu, набрав более 3,4 млн баллов
17.04.2025 10:18:22 | ferra.ru

Миллиарды на сотах и борьба с регуляторами: что показали и скрыли в сериале о пионере мобильной связи Яне Стенбеке
17.04.2025 10:17:48 | Хабр

ИИ Microsoft Copilot научился «видеть», что происходит на вашем экране в браузере Edge
17.04.2025 10:07:22 | ferra.ru

ПОТРАЧЕНО–2. Как тестировать локализацию переводов, чтобы потом не было стыдно
17.04.2025 10:02:31 | Хабр

Redmi Note 14S — переиздание Note 13 Pro 4G — уже в РФ по цене от 26 тыс рублей
17.04.2025 10:00:37 | ferra.ru

OpenAI выпустила сразу две новые «размышляющие» модели o3 и o4-mini
17.04.2025 09:59:21 | ferra.ru

[Перевод] Астрономы выжали из «Уэбба» максимум, чтобы сфотографировать самые удалённые галактики
17.04.2025 09:55:03 | Хабр

Nothing пообещала высокую игровую производительность в смартфоне CMF Phone 2 Pro
17.04.2025 09:52:21 | ferra.ru

В США власти намерены запретить доступ американцев к китайской нейросети DeepSeek
17.04.2025 09:50:33 | ferra.ru

Антиспам бот для телеграм группы на Gigachat2
17.04.2025 09:50:02 | Хабр

Как не наступить на змею при написании CLI
17.04.2025 09:46:25 | Хабр

Google отказалась от доменов стран для поиска
17.04.2025 09:45:58 | ferra.ru

Минтруд предложил уточнить признаки трудовых отношений в законе, чтобы бизнес не уклонялся от официального оформления — РБК
17.04.2025 09:45:29 | vc.ru

Нобелевский лауреат объяснил, почему мы стареем и умираем
17.04.2025 09:43:20 | ferra.ru

Наше расследование: ищем отечественные микросхемы в «отечественных» счетчиках электроэнергии. Часть 3
17.04.2025 09:38:45 | Хабр

Найден простой способ узнать, сколько денег вы потратили на игры в Steam за все время
17.04.2025 09:36:20 | ferra.ru

Смотреть все

НОВОСТИ

Экс-полицейский стал первым британцем, которого лишили паспорта за «связи с РФ»
12.04.2026 14:43:20 | Life.ru

Фигурантов дела о взрыве на складе пиротехники во Владикавказе арестовали
12.04.2026 14:42:19 | Life.ru

Буданов* анонсировал новый обмен пленными в ближайшие дни
12.04.2026 14:40:21 | Life.ru

Украина атаковала Белгородскую область 24 снарядами и 115 дронами за сутки
12.04.2026 14:39:10 | Lenta.ru

Двух жителей Владивостока задержали после сообщений о стрельбе
12.04.2026 14:38:41 | ТАСС

На борту задержанного Швецией судна «Хуэй Юань» нет россиян
12.04.2026 14:38:37 | Life.ru

Москвич годами «любовался» тёщей через скрытую камеру, пока его телефон не оказался у жены
12.04.2026 14:37:19 | Life.ru

В Подмосковье священник облил прихожан водой из кубка во время службы
12.04.2026 14:36:48 | Lenta.ru

В ВСУ пожаловались, что могут остаться без дронов на оптоволокне
12.04.2026 14:34:22 | ТАСС

Британец впервые лишился гражданства из-за связи с Россией
12.04.2026 14:34:07 | Lenta.ru

Крокодил напал на нырявшего с аквалангом пенсионера
12.04.2026 14:32:21 | Lenta.ru

Сальдо раскрыл ложь Украины о собственном бюджете
12.04.2026 14:32:04 | Lenta.ru

Sunday Times: В Британии впервые лишили гражданства за "связи с Россией"
12.04.2026 14:32:00 | Российская Газета

Уиткофф и Аракчи чуть не устроили драку в ходе переговоров в Исламабаде
12.04.2026 14:31:33 | Life.ru

Al Arabiya: Уиткофф и Кушнер остались в Исламабаде
12.04.2026 14:29:00 | Российская Газета

В окаменелости возрастом 289 миллионов лет нашли древнейший дыхательный аппарат
12.04.2026 14:29:00 | Российская Газета

Суд арестовал фигурантов дела о взрыве пиротехники во Владикавказе
12.04.2026 14:28:40 | Коммерсантъ

Буданов* считает, что пасхальное перемирие не продлится долго
12.04.2026 14:26:21 | Life.ru

В МВД посоветовали россиянам собирать пароль из абсурдных фраз
12.04.2026 14:24:21 | Life.ru

В Танзании фермеры необычным образом возрождают леса - без посадки саженцев
12.04.2026 14:24:00 | Российская Газета

MK.RU раскрыл "прибалтийский маршрут" дронов ВСУ к Усть-Луге
12.04.2026 14:24:00 | Российская Газета

ВСУ выпустили по Белгородской области 115 беспилотников и 24 боеприпаса за сутки
12.04.2026 14:23:20 | ТАСС

Мамкин сын из Оренбурга через суд делит с бывшей женой детский комод и морозилку
12.04.2026 14:22:34 | Life.ru

Лукашенко подтвердил планы посетить Парад Победы в Москве
12.04.2026 14:22:16 | Life.ru

Песков назвал точку отсчета очень сложных переговоров с Украиной
12.04.2026 14:22:02 | Lenta.ru

В Кремле оценили вероятность создания Европой собственного оборонного альянса
12.04.2026 14:21:05 | Lenta.ru

Песков: РФ принимает и совершенствует меры для защиты НПЗ и предприятий от атак ВСУ
12.04.2026 14:20:29 | ТАСС

Песков: РФ принимает меры для защиты НПЗ от атак ВСУ, но враг достаточно коварен
12.04.2026 14:20:29 | ТАСС

Два жителя Белгородской области найдены мертвыми после субботнего обстрела
12.04.2026 14:15:03 | Коммерсантъ

Песков: Путин велел армии РФ быть готовой к провокациям от ВСУ в перемирие
12.04.2026 14:12:01 | Life.ru

Более 70 человек эвакуировали из-за подтопления жилых домов в Томской области
12.04.2026 14:11:25 | Life.ru

Песков: действия и Путина, и Трампа могут приводить к скачкам счетов за энергию в Британии
12.04.2026 14:11:21 | ТАСС

Песков: действия Путина и Трампа могут вести к росту счетов в Великобритании
12.04.2026 14:11:21 | ТАСС

Актрису турецкого сериала «Зимородок» Алейну Бозок задержали в Стамбуле
12.04.2026 14:09:14 | Life.ru

Троих фигурантов дела о взрыве во Владикавказе арестовали на два месяца
12.04.2026 14:08:59 | ТАСС

Все новости

ВСЕ НОВОСТИ

ПИШИТЕ

Техническая поддержка проекта ВсеТут

info@vsetut.pro