Операция выполнена!

info@vsetut.pro

Стать автором

Вернуться

Архитектура AI-сервисов: почему монолит убивает latency и GPU

21.05.2026 06:51:18 | Хабр

Хабы: Блог компании OTUS, Карьера в IT-индустрии, Data Engineering, Искусственный интеллект

Ваш AI‑чат или автокомплит тормозит при 50 запросах в секунду? Монолит убивает GPU и латенси?

В этом туториале — реальная архитектура low‑latency инференса на high‑load: почему изолированный inference‑bundle вместо монолита, как выбрать между vLLM и SGLang без маркетинга, зачем нужны continuous batching и admission control.

Читать разбор

Подробнее

Читайте также

Процессы: чего до сих пор не хватало обычным BPM (Часть 2)
21.05.2026 06:47:41 | Хабр

Книжный салон — дополнительные книги от издательства «БХВ». Предзаказ
21.05.2026 06:34:01 | Хабр

Как продакту довести фичу до прода без PMBOK и PRINCE2
21.05.2026 06:31:12 | Хабр

Оргмодель, процессы и агенты (Часть 1)
21.05.2026 06:24:39 | Хабр

Probe-сеть из 10 регионов: что я не учёл про AS-разнесённость
21.05.2026 06:23:05 | Хабр

Как автоматизировать повторную обработку сообщений из архива в DATAREON Platform
21.05.2026 06:01:06 | Хабр

Arguments to Config — простая и мощная библиотека для парсинга аргументов в CLI-приложении на C#
21.05.2026 05:56:29 | Хабр

Как я обучил GPT с нуля на русском языке — и что из этого получилось
21.05.2026 05:52:51 | Хабр

Миллион алых нод: о выборе баз данных для хранения больших объёмов
21.05.2026 05:09:59 | Хабр

Билеты, баги и БДСМ: хроники тревел-стартапа
21.05.2026 05:09:57 | Хабр

От vSphere к VCD: как мы построили хранилище образов и нативный CSI для Kubernetes
21.05.2026 05:05:49 | Хабр

Фолдинг белка на ноутбуке. De novo дизайн KRAS G12D (Switch II) ингибитора. Докинг, валидация в AlfaFold Server и PyMOL
21.05.2026 03:36:42 | Хабр

В ЛЭТИ разработали метрику для оценки минимальной точности нейросетей
20.05.2026 23:56:19 | ferra.ru

«Аэрофлот» создал ИИ-аватара для помощи пассажирам
20.05.2026 23:50:22 | ferra.ru

Тебя уволят, и ничего не сломается. Возможно, станет даже лучше
20.05.2026 23:16:30 | Хабр

«Роснано», ИТМО и ОМЗ создадут фотонные технологии для ЦОД
20.05.2026 23:06:33 | ferra.ru

ИИ от Anthropic вскрыл банки G20, Цукерберг уволил 8000 человек за один день, а мы это пропустили
20.05.2026 23:04:17 | Хабр

Один за всех: как я в одиночку тащу фуллстек-проект, который незаметно разросся до соцсети
20.05.2026 22:43:21 | Хабр

Реакционная лженаука. Как СССР осудил кибернетику — и чем это аукнулось для ИИ
20.05.2026 22:39:00 | Хабр

В Томске разработали метод ускорения термической очистки воды
20.05.2026 22:34:17 | ferra.ru

ИИ-систему Шереметьево внедрят в другие аэропорты России
20.05.2026 22:24:12 | ferra.ru

Google «радикально» обновила поисковую строку. ИИ на первом месте
20.05.2026 22:20:38 | ferra.ru

Очки дополненной реальности XReal и Google поступят в продажу до конца года
20.05.2026 22:20:29 | ferra.ru

В России создали ферментную композицию против устойчивого стафилококка
20.05.2026 21:38:24 | ferra.ru

Figma представила ИИ-агента для Figma Design — он встроен в рабочее пространство
20.05.2026 21:31:34 | vc.ru

Смартфоны Infinix Hot 70 с меняющим цвет корпусом выйдут 25 мая
20.05.2026 21:20:36 | ferra.ru

Инсайдер: Honor Power3 получит аккумулятор от 11 000 до 12 000 мА·ч
20.05.2026 21:20:31 | ferra.ru

Саратовская область и VK Tech договорились о развитии ИИ
20.05.2026 21:20:09 | ferra.ru

«Аэрофлот» запустит голосового ИИ-помощника
20.05.2026 20:46:43 | ferra.ru

Лёгкий мониторинг Proxmox-кластера: Pulse вместо большого Zabbix-стека
20.05.2026 20:45:37 | Хабр

Роскосмос: искусственный интеллект будет управлять Российской орбитальной станцией
20.05.2026 20:30:00 | ferra.ru

RAG для тех, кто разочаровался: почему retrieval ломается и как это починить
20.05.2026 20:25:11 | Хабр

Три уровня субъективной реальности: почему непонимание в командах заложено биологически
20.05.2026 20:22:30 | Хабр

Google представила прорывные ИИ-модели: очень быстрые ответы и создание видео
20.05.2026 20:20:33 | ferra.ru

Дирижёр вместо конвейера: как AI ломает классический pipeline разработки
20.05.2026 20:17:16 | Хабр

Смотреть все

НОВОСТИ

В украинской Самаре произошел пожар после удара
06.07.2026 23:33:39 | Lenta.ru

В подконтрольной Киеву части Запорожской области снова произошли взрывы
06.07.2026 23:32:25 | ТАСС

Аш-Шараа: Сирия может вскоре получить восемь авиалайнеров Airbus
06.07.2026 23:29:46 | ТАСС

В доме основателя ВЭФ Клауса Шваба в Женеве нашли прослушку
06.07.2026 23:29:20 | Life.ru

Макрон вновь нарушил этикет
06.07.2026 23:27:53 | Lenta.ru

В Греции потребовали отставки главного советника премьера после розыгрыша Вована и Лексуса
06.07.2026 23:23:03 | Lenta.ru

Огромный пожар охватил терминал ВСУ в Днепропетровской области поле прилета
06.07.2026 23:23:00 | Российская Газета

Лавров прибыл с визитом в Эфиопию
06.07.2026 23:19:53 | ТАСС

Солист государственного оркестра утонул после наезда гидроцикла
06.07.2026 23:16:00 | Lenta.ru

В Киеве объявляли воздушную тревогу в четвертый раз за день
06.07.2026 23:14:50 | ТАСС

Украина согласилась обменять дроны на польские МиГ-29
06.07.2026 23:12:55 | Life.ru

Внесенный в Раду экологический законопроект сравнили с ударами ВС России
06.07.2026 23:05:44 | Lenta.ru

Украинские боевики сели на 15 лет за террор в приграничье
06.07.2026 23:05:00 | Life.ru

В Новгородской области объявили режим ракетной опасности
06.07.2026 23:03:28 | ТАСС

Позицию России назвали удерживающей мир от третьей мировой войны
06.07.2026 22:58:47 | Lenta.ru

Слуцкий раскритиковал "переговорщика" Стубба после слов об ударах Киева по РФ
06.07.2026 22:57:41 | ТАСС

Представители медиарынка попросили власти доработать законопроект о развитии ИИ
06.07.2026 22:57:34 | Коммерсантъ

Восемь оппозиционных партий Армении выступили в поддержку Гагика Царукяна
06.07.2026 22:55:40 | РБК

Джейсон Шрайер сообщил о массовых сокращениях в студиях Zenimax Online и id Software
06.07.2026 22:55:23 | PlayGround.ru

Аш-Шараа рассчитывает на помощь Франции в инфраструктурных проектах
06.07.2026 22:54:40 | ТАСС

Блок Карапетяна осудил репрессии властей Армении против оппозиционера Царукяна
06.07.2026 22:54:19 | ТАСС

Стубб заявил, что все лидеры НАТО поддерживают удары Киева по РФ
06.07.2026 22:54:07 | Life.ru

Как механики разводят на деньги: четыре схемы обмана в автосервисе
06.07.2026 22:50:00 | За рулем

Смартфоны Redmi Turbo 5 стали хитом — продано уже 2 миллиона штук (всего за полгода)
06.07.2026 22:49:00 | iXBT.com

Луна как гигантский детектор: ученые предложили неожиданный способ «ловить» гравитационные волны
06.07.2026 22:46:00 | iXBT.com

Оценены шансы сборной Англии завоевать медали на ЧМ-2026
06.07.2026 22:45:25 | Lenta.ru

Bloomberg: основатель ВЭФ обратился в полицию, обнаружив "прослушку" в доме
06.07.2026 22:44:41 | ТАСС

Мосбиржа разрешила торговать валютными облигациями в долларах
06.07.2026 22:44:40 | Коммерсантъ

В Поморье самолет Ан-2 при посадке задел крылом служебный автомобиль
06.07.2026 22:42:48 | ТАСС

ХАМАС объявил о роспуске своего правительства в Газе и передаче власти
06.07.2026 22:42:20 | РБК

В Киеве снова объявляли воздушную тревогу
06.07.2026 22:40:44 | ТАСС

Число жертв землетрясения в Венесуэле выросло до 3,5 тыс.
06.07.2026 22:39:37 | ТАСС

Лантратова обратилась в ООН после удара по автобусу под Белгородом
06.07.2026 22:39:01 | Life.ru

Атакованную ВСУ панораму Севастополя захотели показать иностранным журналистам
06.07.2026 22:37:00 | Lenta.ru

В Богородицке Тульской области при пожаре погибли два человека
06.07.2026 22:36:58 | ТАСС

Все новости

ВСЕ НОВОСТИ

ПИШИТЕ

Техническая поддержка проекта ВсеТут

info@vsetut.pro

Copyright © 2026 - vsetut.pro