Как справиться с нагрузкой в черную пятницу? Автоскейлинг инференса в Kubernetes

Операция выполнена!

info@vsetut.pro

Стать автором

Вернуться

Как справиться с нагрузкой в черную пятницу? Автоскейлинг инференса в Kubernetes

18.09.2024 14:19:10 | Хабр

Хабы: Блог компании Selectel, Программирование, IT-инфраструктура, Машинное обучение, Kubernetes

У многих наступление осени вызывает разные чувства и эмоции: от ностальгии во время просмотра Гарри Поттера под теплым пледом до депрессивных мыслей у дождливого окна в кофейне. Именно в этот период компании проводят масштабные мероприятия, одно из них — известная черная пятница. Клиенты пытаются «урвать» по хорошей скидке товары и купить подарки к Новому году. В связи с этим «атакуют» своим трафиком популярные сайты e-commerce, которые могут быть не готовы к такой нагрузке.

Ни для кого не секрет, как сохранить и инфраструктуру в пиковые нагрузки, и трафик клиентов. При этом не понести большие убытки. Деплоим сервис в облако, скейлим ресурсы по требованию и радуемся продажам! Но это в e-commerce, мы же с вами интересуемся ML production.

Привет, Хабр! Я — Антон, DevOps-инженер в команде Data/ML-продуктов Selectel. В этой статье расскажу, зачем нужен автоскейлинг GPU-ресурсов, как настроить масштабирование реплик в Kubernetes по трафику, а также как сделать свой высоконагруженный ChatGPT. Читать дальше →

Подробнее

Читайте также

Нейросеть для создания персонажа 2D игры
18.09.2024 14:15:56 | Хабр

Вышедшая в 2013 г. GTX 780 Ti справилась почти со всеми современными играми в 1080p
18.09.2024 14:15:00 | ferra.ru

ВКС-лето: звонки с SIP-терминала в FaceTime и портативные голографические дисплеи
18.09.2024 13:38:13 | Хабр

Компьютерное зрение и котики. Или алгоритмы против человека
18.09.2024 13:38:02 | Хабр

Wildberries заявил о попытке Бакальчука «незаконно проникнуть» в офис компании — тот назвал ситуацию «провокацией»
18.09.2024 13:37:23 | vc.ru

Дешёвые видеокарты RTX 3050 6 ГБ и RX 6500 XT 4 ГБ сравнили в играх
18.09.2024 13:30:00 | ferra.ru

Лайфхаки для быстрой проверки гипотез: упрощаем пользовательские интервью
18.09.2024 13:16:51 | Хабр

1С зависает, а бизнес теряет деньги: как построить ИТ-инфраструктуру, чтобы этого избежать
18.09.2024 13:16:48 | Хабр

Как мы задумали небольшую музейную выставку, а в итоге открыли два неизвестных советских компьютера. Часть 1
18.09.2024 13:15:44 | Хабр

[Перевод] Ассемблер для программистов на языках высокого уровня: Hello World
18.09.2024 13:01:41 | Хабр

Айтишный пицца-квест. Итоги 2024
18.09.2024 13:01:31 | Хабр

Искусственный интеллект придет на помощь безработным: новый эксперимент в США
18.09.2024 13:00:36 | Хабр

Россияне начали жаловаться на выход iPhone из строя после обновления iOS
18.09.2024 12:56:32 | ferra.ru

Почему Google Gemini не пользуется популярностью среди разработчиков?
18.09.2024 12:47:08 | Хабр

«Ситидрайв» запустится в Нижнем Новгороде
18.09.2024 12:46:48 | vc.ru

Компания, из-за которой у Apple были проблемы, начала работать с Google и Qualcomm
18.09.2024 12:45:00 | ferra.ru

Энтузиазм — как заменить «надо» на «хочу» и с удовольствием идти к цели
18.09.2024 12:38:47 | Хабр

Демократизация DevOps
18.09.2024 12:23:15 | Хабр

Реализация Bloom-фильтров в Golang
18.09.2024 12:16:32 | Хабр

SAP Scripts на C#
18.09.2024 12:15:29 | Хабр

Акции китайских производителей полупроводников подпрыгнули после «прорыва на 65 нм»
18.09.2024 12:05:13 | it-world

Northrop Grumman начнёт производить спутниковые антенны для военных самолётов
18.09.2024 12:00:00 | ferra.ru

Подходы к Использованию Git и Контролю Версий
18.09.2024 11:59:06 | Хабр

Трекер привычек в Notion. Как отслеживать полезные и приучить себя к тому, что нужно
18.09.2024 11:57:21 | Хабр

Аммиак для полупроводников: патентный анализ
18.09.2024 11:54:06 | Хабр

ЦБ и Минфин протестируют международный расчёт в криптовалюте
18.09.2024 11:42:59 | ferra.ru

Подтверди принадлежность к ай-ти!
18.09.2024 11:36:03 | it-world

Что можно улучшить в приложении? часть 3. Крадем как художники у Впрок
18.09.2024 11:24:49 | Хабр

Лидеры опенсорс-проектов России: кто формирует будущее машинного обучения?
18.09.2024 11:22:47 | it-world

Разгорается битва между Илоном Маском и FAA: штрафуют, не выдают разрешений
18.09.2024 11:22:30 | it-world

Аутстафф: галера или новый люкс?
18.09.2024 11:18:09 | Хабр

Stellantis вряд ли получит от Европы деньги на производство аккумуляторов
18.09.2024 11:15:00 | ferra.ru

ТРИЗ и Траблшутинг, что такое troubleshooting в бизнесе и кто такой troubleshooter (траблшутер)
18.09.2024 11:14:54 | Хабр

NDA talks. Финансовый кризис. Эра HFT. Построение биржи
18.09.2024 11:02:04 | Хабр

Реализация подписчиков в c++ — пляшем от печки
18.09.2024 11:00:33 | Хабр

Смотреть все

НОВОСТИ

Названы десять поломок, которые водители готовы починить сами
28.03.2026 14:30:00 | За рулем

Трамп удивился реакции трех стран на просьбу США по войне с Ираном
21.03.2026 14:04:10 | Lenta.ru

Трамп собрался тесно сотрудничать с одной европейской страной
21.03.2026 14:02:49 | Lenta.ru

Россия нанесла удар по расположению иностранных наемников ВСУ
21.03.2026 14:02:30 | Lenta.ru

Российскому призеру Олимпиады дали визу за два дня до старта этапа КМ
21.03.2026 13:59:37 | РБК

Орбан заявил, что Брюссель убивает европейскую демократию ради Украины
21.03.2026 13:58:59 | Life.ru

Mash: провайдеры домашнего интернета в Москве срочно внедряют систему «белых списков»
21.03.2026 13:58:00 | iXBT.com

Иран выпустил купюру в десять миллионов риалов
21.03.2026 13:57:52 | Lenta.ru

Минпросвещения готовит учебники по родным языкам народов РФ
21.03.2026 13:57:02 | Life.ru

Обвинение обжаловало приговор осужденному за взятку Муминджанову
21.03.2026 13:56:25 | РБК

Модифицированная ракета Vulcan готовится к запуску летом 2026 года
21.03.2026 13:56:00 | iXBT.com

Иранца и румынку обвинили в попытке проникнуть на базу подлодок в Шотландии
21.03.2026 13:55:00 | Российская Газета

Процессор iPhone 16 Pro неплохо тянет Cyberpunk 2077 и другие тяжелые игры — это показал тест бюджетного MacBook Neo
21.03.2026 13:55:00 | iXBT.com

Силы ПВО сбили ещё один украинский БПЛА, летевший на Москву
21.03.2026 13:53:58 | Life.ru

Бензовоз загорелся после массового ДТП на трассе «Ростов — Таганрог»
21.03.2026 13:53:41 | Life.ru

В ЕС отреагировали на отказ Киева в допуске на нефтепровод «Дружба»
21.03.2026 13:53:41 | Lenta.ru

Бензовоз вспыхнул после массового ДТП на трассе «Ростов — Таганрог», есть жертвы
21.03.2026 13:53:41 | Life.ru

Tasnim: в Иране задержали пять человек о подозрению в шпионаже в пользу Израиля
21.03.2026 13:53:09 | ТАСС

Глава МО Израиля: интенсивность атак на цели в Иране возрастет в ближайшие дни
21.03.2026 13:52:19 | ТАСС

Сайты из «белого списка» начнут работать без Сети и от домашнего Wi-Fi
21.03.2026 13:52:09 | Life.ru

Системы ПВО ОАЭ перехватили три иранские ракеты и восемь БПЛА
21.03.2026 13:51:56 | ТАСС

Ситуация на месте падения обломков БПЛА на дом в Уфе находится под контролем
21.03.2026 13:50:38 | ТАСС

Овечкин назвал способного стать лицом российского хоккея спортсмена после его ухода
21.03.2026 13:49:45 | Lenta.ru

Орбан: лидеры ЕС перестали защищать интересы европейцев
21.03.2026 13:49:26 | ТАСС

Миронов предложил вернуть программу детского кешбэка за отдых в лагере
21.03.2026 13:49:12 | Life.ru

Эксперимент ATLAS установил новые жёсткие ограничения на параметры суперсимметрии
21.03.2026 13:49:00 | iXBT.com

Союз российских соотечественников в Таиланде заявил о важности сохранения контактов с РФ
21.03.2026 13:48:34 | ТАСС

Бензовоз загорелся на трассе в Ростовской области, очевидцы сообщили о жертвах // На трассе в Ростовской области после ДТП загорелся бензовоз
21.03.2026 13:48:33 | Коммерсантъ

Три человека погибли при возгорании бензовоза на трассе в Ростовской области
21.03.2026 13:48:33 | Коммерсантъ

Иран нанес удар по топливным резервуарам в аэропорту Тель-Авива
21.03.2026 13:48:00 | Lenta.ru

В Москве электробусы нового поколения вышли на маршрут №214
21.03.2026 13:45:32 | ТАСС

Ирина Болгар опубликовала новые фото с детьми и Павлом Дуровым
21.03.2026 13:45:31 | Life.ru

Главный тренер сборной Никарагуа провёл параллели между Россией и Аргентиной
21.03.2026 13:44:58 | Life.ru

CNN рассказал, почему США решили ослабить санкции против иранской нефти
21.03.2026 13:44:49 | РБК

Гунба выразил соболезнования из-за смерти Владимира Зантарии
21.03.2026 13:44:43 | ТАСС

Все новости

ВСЕ НОВОСТИ

ПИШИТЕ

Техническая поддержка проекта ВсеТут

info@vsetut.pro

Copyright © 2026 - vsetut.pro