Cколько железа нужно ИИ-агенту? Как мы считали ресурсы для on-premise LLM и почему калькуляторы ошиблись в 5 раз

12.06.2026 10:36:44 | Хабр

Хабы: Блог компании LLMStart.ru, Искусственный интеллект, Машинное обучение, Программирование, Управление продуктом

На связи Сергей Смирнов, AI-инженер и основатель LLMStart.ru. Один из самых частых вопросов от бизнеса: «Сколько и какого железа нужно, чтобы развернуть ИИ-агента у нас на серверах?».

В новом on-premise проекте нам нужно было оценить, сколько одновременных диалогов вытянет связка из двух RTX Pro 6000 Blackwell и модели GPT-OSS-120B. Популярный калькулятор пообещал 5000 токенов в секунду, но реальность оказалась в 5 раз медленнее!

В статье рассказываю, как правильно считать ресурсы под LLM, почему формулы ломаются на нестандартном железе и как мы устроили хардкорный краш-тест, чтобы дать заказчику железные гарантии.

Подробнее

Читайте также

Дифференцированный технологический сбор
12.06.2026 10:26:19 | it-world

Как пополнить App Store в России в 2026 году
12.06.2026 10:25:55 | vc.ru

Google обратилась к Samsung для производства тензорных процессоров
12.06.2026 10:19:41 | ferra.ru

В России разработали ИИ для оценки риска при инфарктных состояниях
12.06.2026 10:04:00 | ferra.ru

QR-код. От финтех-прорыва к нишевому инструменту
12.06.2026 10:00:00 | it-world

13 лет в рекрутинге — и вот что я поняла про найм в IT, о чём обычно молчат
12.06.2026 09:57:33 | Хабр

Платформенная экономика в России: системный кризис регулирования и пути его преодоления
12.06.2026 09:49:39 | Хабр

Как я за 6 месяцев превратил ИТ-ад в конвейер: личный опыт в компании-единороге
12.06.2026 09:46:19 | Хабр

Как я за 6 месяцев превратил ИТ-ад в конвейер: личный опыт в компании-единороге с 4 млрд пользователей
12.06.2026 09:46:19 | Хабр

Как начать начать делать игры, если ничего не умеешь?
12.06.2026 09:41:27 | Хабр

Telegram Bot API 10.1: Революция форматирования
12.06.2026 09:25:04 | Хабр

Вайб-кодеры пришли на биржу. Что стало с фрилансом к середине 2026
12.06.2026 09:24:24 | Хабр

Xiaomi представила ИИ для программистов, который «всё помнит»
12.06.2026 09:22:16 | ferra.ru

Как сделать афишу и плакат с помощью нейросети: Тестируем ИИ для генерации постеров и рекламных баннеров
12.06.2026 09:19:14 | Хабр

[Перевод] Мои ученики не умеют читать
12.06.2026 09:17:21 | Хабр

Записки эйчара: ChatGPT, что ты наделал с наймом?
12.06.2026 09:12:19 | Хабр

Стеклодувное дело. Ранние стеклодувные горелки на жидком топливе
12.06.2026 09:01:12 | Хабр

Как Maersk пережила IT-апокалипсис, стала укрытием для наркокартелей и создала корабль будущего
12.06.2026 08:46:36 | Хабр

Не давайте ИИ-агенту прямой доступ к базе. Как я проектировал безопасный контур действий на FastAPI и PostgreSQL
12.06.2026 08:41:02 | Хабр

Какой ИИ для курсовой работы использовать в 2026
12.06.2026 08:11:13 | Хабр

Аппаратная метрика. Оживляем счётчик покупателей
12.06.2026 08:05:52 | Хабр

Радиоактивный распад урана-238
12.06.2026 08:03:57 | Хабр

Создаем автономный анализатор логов на локальных ИИ моделях
12.06.2026 08:01:50 | Хабр

«Примитивная» игра 80-х, которая умела генерировать бесконечные миры
12.06.2026 08:00:20 | Хабр

Shrinking: как property-тест сводит мусорный контрпример к минимуму
12.06.2026 07:50:35 | Хабр

«Кланы» Кремниевой долины. Кто решает, какой стартап получит миллионы — рынок или нетворк?
12.06.2026 07:43:33 | Хабр

Google использовала песни с YouTube для обучения ИИ. На неё подали в суд
12.06.2026 07:22:15 | ferra.ru

[Перевод] Создание воксельных ассетов: Разбор личного кейса
12.06.2026 07:11:19 | Хабр

Асинхронный django: новые начинания
12.06.2026 07:07:03 | Хабр

Как создавались национальные вычислительные школы в разных странах и что из этого вышло
12.06.2026 07:05:14 | Хабр

Windows 12 не будет: Microsoft делает ставку на ИИ и ARM
12.06.2026 07:02:13 | Хабр

Графический интерфейс Мандельброта: Визуализатор с методом возмущений и предела 1e-308
12.06.2026 07:00:04 | Хабр

Маркетинговая стратегия с ИИ: воркфлоу и реальные промпты
12.06.2026 06:41:02 | Хабр

5 ИИ-цивилизаций оставили на 15 дней. Claude построил утопию, Grok погиб за 4 дня
12.06.2026 06:31:22 | Хабр

Где роботы уже меняют бизнес: от спасения урожая до развития городов будущего
12.06.2026 06:20:55 | Хабр

Смотреть все

НОВОСТИ

Приставы начали взыскивать с Ларисы Долиной неоплаченный штраф ГИБДД
28.07.2026 03:56:42 | Life.ru

Крашенинников выступил за принятие закона о риелторской деятельности
28.07.2026 03:53:22 | ТАСС

Депутат Бородай назвал предательством атаки ВСУ на мирных россиян
28.07.2026 03:53:04 | ТАСС

В Раде сообщили о политическом сигнале Зеленского Трампу
28.07.2026 03:53:00 | Lenta.ru

Жителя Камчатки осудили за избиение чужого ребенка
28.07.2026 03:52:05 | ТАСС

Посол РФ заявил, что российскому бизнесу есть за что побороться в Индонезии
28.07.2026 03:47:56 | ТАСС

Президент «Динамо-Владивосток» Эдуард Сандлер разбился насмерть на гидроцикле
28.07.2026 03:47:54 | Life.ru

В Приморье назвали причину смерти мальчика в школе Хорольского округа
28.07.2026 03:47:36 | ТАСС

Духовный щит России: Как Крещение Руси стало фундаментом нашей цивилизации
28.07.2026 03:42:54 | Life.ru

Духовный щит России: Как крещение князя Владимира стало фундаментом нашей цивилизации
28.07.2026 03:42:54 | Life.ru

Погиб главный тренер баскетбольного "Динамо" из Владивостока Эдуард Сандлер
28.07.2026 03:39:30 | ТАСС

Подполье рассказало, что делают с отзывающимися эвакуировать детей украинцами
28.07.2026 03:35:49 | ТАСС

В Ивановской области объявили угрозу атаки беспилотников
28.07.2026 03:33:20 | ТАСС

ТАСС: дело Лерчек передали другому федеральному судье
28.07.2026 03:31:09 | ТАСС

Материалы дела Лерчек передали другому федеральному судье
28.07.2026 03:31:09 | ТАСС

Посол в РФ назвал исчерпывающим ответ Ирана о возобновлении переговоров с США
28.07.2026 03:31:05 | ТАСС

Посол в РФ сообщил об исчерпывающем ответе Тегерана о переговорах с США
28.07.2026 03:31:05 | ТАСС

Тайну кораблекрушения раскрыли благодаря византийскому золоту
28.07.2026 03:30:53 | Lenta.ru

Россиянин побывал летом в Европе и описал траты на поездку фразой «не космические деньги»
28.07.2026 03:30:39 | Lenta.ru

Microsoft назвала предупреждением инцидент со взломом стартапа ИИ-моделью OpenAI
28.07.2026 03:30:33 | ТАСС

В Южной сообщили об использовании дронов-"ждунов" в эвакуации из Константиновки
28.07.2026 03:30:20 | ТАСС

Дым заполнил поезд: Пожар в метро Барселоны отправил десятки людей в больницы
28.07.2026 03:27:40 | Life.ru

Епископ Гедеон назвал условия единения народов на пространстве исторической Руси
28.07.2026 03:27:33 | ТАСС

ЛДПР предложила закрепить на федеральном уровне услугу "Социальная няня"
28.07.2026 03:27:22 | ТАСС

Умер президент и главный тренер российского баскетбольного клуба
28.07.2026 03:26:39 | Lenta.ru

Лерчек могут ужесточить меру пресечения из-за приобретения билетов в Петербург
28.07.2026 03:22:39 | Life.ru

Японский индекс Nikkei снижается на 3%
28.07.2026 03:22:09 | ТАСС

В США предрекли серьезные последствия украинского конфликта
28.07.2026 03:19:49 | Lenta.ru

NYP: Нетаньяху представит Трампу разведданные о ядерной программе Ирана
28.07.2026 03:19:03 | Life.ru

Вулканолог Демянчук спрогнозировал очередное извержение Ключевской Сопки
28.07.2026 03:18:03 | ТАСС

Вулканолог Демянчук спрогнозировал очередное извержение вулкана Ключевская Сопка
28.07.2026 03:18:03 | ТАСС

Тегеран связался с Москвой на фоне атак ВСУ на иранское судно
28.07.2026 03:15:48 | Lenta.ru

Школьники из Миссисипи спасли своего турагента, который чуть не утонул в океане
28.07.2026 03:14:49 | Life.ru

В США только 33% опрошенных поддерживают удары по Ирану
28.07.2026 03:11:44 | ТАСС

Партнерше отрицающего секс-игрушки молодого человека дали совет
28.07.2026 03:11:16 | Lenta.ru

Все новости

ВСЕ НОВОСТИ

ПИШИТЕ

Техническая поддержка проекта ВсеТут

info@vsetut.pro