Операция выполнена!

info@vsetut.pro

Стать автором

Вернуться

Тестируем NVIDIA HGX B300 — инференс-сервер с 8 GPU и 2,3 ТБ VRAM на DeepSeek, Qwen и MiniMax

15.05.2026 08:00:19 | Хабр

Хабы: Блог компании Selectel, IT-инфраструктура, Искусственный интеллект, Машинное обучение, Компьютерное железо

Итак, вы внедрили ИИ в свой сервис и решили ехать в продакшен, где у вас много пользователей. Закономерно возникает вопрос — а на чем запустить инференс, чтобы и пользователи были довольны скоростью работы, и бизнес не разорился.

Привет! На связи Никита, системный архитектор в Selectel. Сегодня я проведу для вас небольшой эксперимент: возьму HGX™ B300 и разверну на нем DeepSeek, Qwen и MiniMax. Зачем? Чтобы протестировать систему на разных задачах, посмотреть получившиеся бенчмарки и сделать выводы о почти топовом серверном GPU от NVIDIA. Заодно кратко вспомним, что получилось, когда мы пытались запустить бюджетный инференс LLM только на CPU. Прошу под кат.

Читать далее →

Подробнее

Читайте также

Devise в Ruby on Rails
15.05.2026 07:57:18 | Хабр

Теряет ли OpenAI деньги на подписках и другие прикидки на салфетке
15.05.2026 07:54:49 | Хабр

Что я узнал, делая прототип банкового чата с ИИ
15.05.2026 07:53:05 | Хабр

NeuroXess. Исследуем мозговой чип из Китая, вживленный уже 54 реципиентам
15.05.2026 07:51:13 | Хабр

Цифровой двойник Атома: как процесс симуляции меняет профессию инженера
15.05.2026 07:46:09 | Хабр

Телеграм-бот переклички автовладельцев на Kotlin Native
15.05.2026 07:43:17 | Хабр

Сравнение моделей конкурентности JVM языков: Kotlin coroutines, ZIO runtime и Clojure
15.05.2026 06:57:21 | Хабр

Гиперэкономия на токенах с API SpeShu.AI: как работает новое кэширование
15.05.2026 06:56:29 | Хабр

Я написал свой DNS-резолвер на Go вместо того, чтобы взять Unbound. Вот почему и что из этого вышло
15.05.2026 06:50:55 | Хабр

Шахматные программы II. Отсечения
15.05.2026 06:33:22 | Хабр

CTE в PostgreSQL: как писать сложные запросы просто
15.05.2026 06:30:44 | Хабр

CRUD без боли: форма запроса как граница безопасности поверх Prisma
15.05.2026 06:14:22 | Хабр

Шахматные программы I. Вступление
15.05.2026 06:03:13 | Хабр

Когнитивная зарубка: Что мы теряем, работая с LLM, и при чём здесь невесомость
15.05.2026 06:02:17 | Хабр

Каким ИИ был до мощных компьютеров?
15.05.2026 06:00:38 | Хабр

[Перевод] 2/7. Целая прорва связных списков, чтобы выучить Rust: Хороший односвязный стек
15.05.2026 06:00:37 | Хабр

Синергия E2E и скриншотных тестов: создание надежной системы тестирования iOS с помощью XCTest
15.05.2026 05:54:00 | Хабр

И пришла тишина
15.05.2026 05:44:02 | Хабр

[Перевод] Гейминг под Linux становится быстрее, потому что Windows API превращаются в фичи ядра Linux
15.05.2026 05:06:30 | Хабр

ИИ в HR: тестирование сотрудников. Практический кейс и промпт проверки знаний правил habr с AI
15.05.2026 05:05:06 | Хабр

Эксперимент с посадкой в самолет по биометрии начнется 1 июня
14.05.2026 23:51:52 | ferra.ru

Теперь все функции ИИ встроены прямо в браузер Microsoft Edge
14.05.2026 23:08:07 | ferra.ru

В Туве обнаружили бронзовый кабаний клык возрастом 3 тысячи лет
14.05.2026 23:07:13 | ferra.ru

В Томске улучшили алюминиевый сплав с помощью базальтовых волокон
14.05.2026 23:05:38 | ferra.ru

Ты выучил язык. Но инженером это тебя не сделало
14.05.2026 22:59:18 | Хабр

В России займутся здоровьем в Арктике
14.05.2026 22:58:12 | ferra.ru

На Камчатке усилилась активность вулкана Безымянный
14.05.2026 22:50:34 | ferra.ru

Когда Кнут признаёт, что Claude решил его задачу за час — пора менять инфраструктуру
14.05.2026 22:43:22 | Хабр

Российский ИИ научили распознавать жесты в перчатках на производстве
14.05.2026 22:32:53 | ferra.ru

Путин поздравил «Российские космические системы» с 80-летием
14.05.2026 22:15:00 | ferra.ru

«Россети» и МФТИ договорились о трансфере технологий для энергетики
14.05.2026 21:44:14 | ferra.ru

Учёные ЧелГУ: древние поселения скучились на левом берегу Синташты из-за рельефа
14.05.2026 21:30:00 | ferra.ru

«Не обязательно взыскивать сейчас, важно сохранить возможность предъявить счёт позже»: Cinemaplex — о «предостережениях», которые российские кинотеатры получают от Warner Bros.
14.05.2026 21:19:08 | vc.ru

В WhatsApp* появились секретные чаты. Но только с ИИ
14.05.2026 21:08:09 | ferra.ru

Сокращения в Cisco, вайб-кодинг с сюрпризом и патриотичный Linux
14.05.2026 21:07:56 | it-world

Смотреть все

НОВОСТИ

Фестивальный Витебск "зажег" зрителей на рок-концерте
15.07.2026 08:07:00 | Российская Газета

В России нашли новый экологичный способ утилизировать нефтяные отходы
15.07.2026 08:06:55 | ТАСС

На севере Украины повреждена автозаправка
15.07.2026 08:06:06 | ТАСС

"Вкусно - и точка" реинвестирует в разработку своего ПО
15.07.2026 08:05:19 | ТАСС

Очередная порция «прилётов»: ВС РФ поразили объекты в украинских портах, занятые военными грузами
15.07.2026 08:04:51 | Life.ru

Более 70% опрошенных россиян использовали СМС из-за ограничений интернета
15.07.2026 08:04:48 | ТАСС

У берегов Камчатки произошли три мощных землетрясения за час
15.07.2026 08:04:07 | Lenta.ru

Spiegel сообщил о сокращении поддержки Украины в «коалиции желающих»
15.07.2026 08:03:46 | Life.ru

В Приморье масштабировали бьюти-акселератор для выхода самозанятых в официальный бизнес
15.07.2026 08:03:42 | ТАСС

Матвиенко поздравила жителей НАО с Днем образования округа
15.07.2026 08:03:17 | ТАСС

Ростех представил комплекс "Паутина" для защиты промышленных объектов от дронов
15.07.2026 08:02:44 | ТАСС

Уничтожение диверсантов и пункт управления дронами у российской деревни попало на видео
15.07.2026 08:02:03 | Lenta.ru

Выставку работ Ильи Репина представили в фестивальном Витебске
15.07.2026 08:02:00 | Российская Газета

Мужчина за обман отправил жену в тюрьму на 65 лет
15.07.2026 08:01:31 | Lenta.ru

В Тюмени самолет вынужденно вернулся в аэропорт вылета
15.07.2026 08:00:06 | ТАСС

Можно ли заболеть от кондиционера: разбираемся, почему люди простужаются даже без мороза
15.07.2026 08:00:00 | Life.ru

Автоперевозки из Китая подорожали на 15-25% из-за топливного кризиса
15.07.2026 08:00:00 | Коммерсантъ

Инвесторы подсластили кофе // Sucden получил контроль над бизнесом производителя кофе Poetti
15.07.2026 08:00:00 | Коммерсантъ

Китайская анимационная студия создает любопытный ролевой экшен BRINGER с уникальной графикой и сеттингом
15.07.2026 07:59:29 | PlayGround.ru

Политолог Еловский считает, что работа ТАСС на МКС поможет вдохновлять россиян
15.07.2026 07:58:23 | ТАСС

Зеленскому присудили нелегкую победу над «величайшим достижением» Евросоюза
15.07.2026 07:57:49 | Lenta.ru

На севере Украины повреждена АЗС
15.07.2026 07:57:30 | ТАСС

Штаты закупили российского чая на максимальную с 2021 года сумму
15.07.2026 07:55:00 | Российская Газета

Не хотите разориться на ремонте после града? Вот что нужно купить прямо сейчас
15.07.2026 07:55:00 | За рулем

ВС РФ ночью нанесли удары по портам Украины, использующимся в интересах ВСУ
15.07.2026 07:54:26 | ТАСС

В Новосибирском зоопарке впервые на свет появились щенки большеухой лисицы
15.07.2026 07:54:09 | ТАСС

Временного поверенного в делах Ирана вызвали в МИД Великобритании
15.07.2026 07:53:34 | ТАСС

Redmi Note 17 Pro оказался не про производительность: появились живые фото и первый отзыв о новинке от Digital Chat Station
15.07.2026 07:52:00 | iXBT.com

Климатолог объяснил аномальную жару в Европе влиянием пустынных антициклонов
15.07.2026 07:50:00 | Life.ru

Строительство премиум жилья за пределами центра Москвы выросло на 64% за пять лет
15.07.2026 07:48:17 | ТАСС

Предсказана судьба Kyivstoner после обвинения в подготовке теракта в Подмосковье
15.07.2026 07:46:51 | Lenta.ru

Найдена необычная причина медленного интернета на компьютере
15.07.2026 07:46:39 | Lenta.ru

В Новосибирске на имущество застройщика наложили арест на 80 млн рублей
15.07.2026 07:46:38 | ТАСС

Экраны некоторых Galaxy S26 Ultra краснеют, Samsung начала расследование
15.07.2026 07:46:00 | iXBT.com

Samsung выпустила One UI 9 Beta 4 на базе Android 17 для Galaxy S26: что нового?
15.07.2026 07:45:00 | iXBT.com

Все новости

ВСЕ НОВОСТИ

ПИШИТЕ

Техническая поддержка проекта ВсеТут

info@vsetut.pro

Copyright © 2026 - vsetut.pro