Ночь с пятницы на понедельник: борьба за устойчивость, когда облако дало сбой

Операция выполнена!

info@vsetut.pro

Стать автором

Вернуться

Ночь с пятницы на понедельник: борьба за устойчивость, когда облако дало сбой

05.02.2026 06:00:06 | Хабр

Хабы: Блог компании Яндекс, Блог компании Yandex Cloud & Yandex Infrastructure, IT-инфраструктура, Сетевые технологии, Высоконагруженные системы

…Был обычный ноябрьский вечер, 2024 год шёл к своему завершению: на носу была «чёрная пятница». Я вернулся домой в Новосибирск из почти двухнедельной командировки, пробыв в пути 12 часов и поспав часа четыре. В 19:07 алерт сообщил мне о падении одного из контроллеров. В целом, проблема не критичная, так как сервисы зарезервированы. Но всё же одним глазом я заглянул в чат с разбором.

Через час ситуация стремительно ухудшилась: каскадом начали отказывать узлы, отвечающие за внешнюю связность. А затем развитие событий приняло фатальный оборот — в какой‑то момент одновременно отказали сервисы внешней связности сразу в двух зонах доступности…

Это был один из самых крупных региональных инцидентов в облаке, после которого мы многое изменили в сети, чтобы сделать её устойчивее. С того момента прошло больше года, так что пришла пора рассказать эту историю от начала и до конца.

В прошлой статье я уже показал наши основные подходы к повышению отказоустойчивости в этой ситуации. Однако за кадром остался сам процесс разработки новых решений и то, как мы мыслили, чтобы найти наилучший выход. Сегодня расскажу об этом подробнее. Статья основана на моём недавнем выступлении на Highload++ и дополнена по следам дальнейших расследований инцидентов.

Читать далее

Подробнее

Читайте также

В 3 ночи мой бот уверенно перепутал «колики» и «голод». Я всё равно его выпустил — и вот почему
05.02.2026 05:51:34 | Хабр

Как мы с помощью ML попали на остров
05.02.2026 05:45:28 | Хабр

От «яблока» до «королевы»: как нейросети учатся понимать смысл слов через эмбеддинги
05.02.2026 05:21:02 | Хабр

MCPHero: MCP tools как native tools в openai
05.02.2026 04:46:23 | Хабр

Обработка 100 000 запросов с помощью виртуальных потоков Java и сравнение производительности с обычными потоками
05.02.2026 04:07:18 | Хабр

[Перевод] Как ИИ-стартап задумал отсканировать и утилизировать миллионы книг
05.02.2026 00:08:25 | Хабр

Алгоритмическая энциклопедия: как навести порядок в мире программных библиотек
04.02.2026 23:39:15 | Хабр

«Атлас Telegram» — как создавалась интерактивная карта с 500 000 каналами
04.02.2026 23:10:32 | Хабр

Айтишники эволюционируют, LG и Samsung притворяются, а стейблкойны требуют решений
04.02.2026 22:55:20 | it-world

Недорогие раскладушки Motorola Razr 2024 начали обновлять до Android 16
04.02.2026 22:34:41 | ferra.ru

Один из крупнейших российских девелоперов «Самолёт» попросил правительство о господдержке — акции компании падали почти на 7% на фоне новости
04.02.2026 22:10:48 | vc.ru

Разработка приложения на Spring Boot, Java, База данных, профиль пользователя. Часть 2
04.02.2026 21:51:29 | Хабр

Акцентор для русского языка для на базе модели со словарем на уровне символов
04.02.2026 21:46:36 | Хабр

Посимвольная нейросетевая модель для автоматической акцентуации русского языка
04.02.2026 21:46:36 | Хабр

Визуализация задачи Дирихле для уравнения Лапласа/Пуассона в прямоугольнике
04.02.2026 20:54:07 | Хабр

Лингвистика эмоджи и стикеров: рождение новой языковой системы
04.02.2026 20:44:16 | Хабр

AMD намекнула на скорый запуск Xbox нового поколения
04.02.2026 20:34:40 | ferra.ru

TCL представила игровой монитор с 320 Гц и Mini-LED
04.02.2026 20:33:16 | ferra.ru

Ритуал создания API в традициях древних ацтеков (часть II)
04.02.2026 20:30:23 | Хабр

Карта российских ИИ-платформ для аналитика
04.02.2026 20:19:01 | Хабр

[Перевод] Подростковый период технологий
04.02.2026 19:30:21 | Хабр

HONOR объявил о коллаборации с российским брендом украшений Sokolov
04.02.2026 18:34:34 | ferra.ru

Asus выпустила игровые наушники с «уникальным» звуком
04.02.2026 18:33:19 | ferra.ru

В Firefox появится кнопка для полного отключения всех ИИ-функций
04.02.2026 18:33:17 | ferra.ru

LLM модель qwen3-coder-next быстрый тест на локальном сервере
04.02.2026 18:29:01 | Хабр

Все об устройстве Q65 с примерами на Python (часть 3)
04.02.2026 18:08:10 | Хабр

unihttp – пишем декларативные API-клиенты на Python
04.02.2026 17:40:04 | Хабр

Запретный плод уже сорван
04.02.2026 17:26:25 | Хабр

Кто такой CDTO и зачем он нужен бизнесу
04.02.2026 17:24:16 | Хабр

Интеграция SIEM с IRIS, Cortex, MISP, n8n (2 часть)
04.02.2026 17:13:55 | Хабр

Эмитент стейблкоина USDT привлечёт всего $5 млрд вместо $15-20 млрд — инвесторов не устроила сумма и оценка компании в $500 млрд
04.02.2026 17:13:51 | vc.ru

Разбираю статью про FS-Researcher: как учёные научили ИИ вести конспекты
04.02.2026 17:11:24 | Хабр

Бургер Кинг и СДЭК добавили в «белые списки» во время ограничений мобильного интернета в РФ
04.02.2026 17:10:17 | ferra.ru

Фанаты обрушились с критикой на Adobe — инструмент Animate всё же не закроют
04.02.2026 16:51:04 | ferra.ru

Телеком Археология, физическая не виртуальная
04.02.2026 16:48:20 | Хабр

Смотреть все

НОВОСТИ

Пентагон признал ранение 390 солдат в войне с Ираном
11.04.2026 16:13:00 | Российская Газета

Самолёт-разведчик США уже семь часов барражирует над Чёрным морем у границ РФ
11.04.2026 16:12:11 | Life.ru

Иран обозначил «красные линии» на встрече с премьером Пакистана
11.04.2026 16:09:36 | Life.ru

Объявленное Путиным в связи с Пасхой перемирие в зоне СВО вступило в силу
11.04.2026 16:08:50 | Life.ru

На Урале к ноябрю разработают проект капремонта моста через реку Утку
11.04.2026 16:08:38 | ТАСС

Букмекеры определили победителя Лиги конференций
11.04.2026 16:07:51 | Lenta.ru

Завершена установка элементов крестов купола и звонниц храма Христа Спасителя
11.04.2026 16:07:33 | ТАСС

В Дагестане арестованы руководители строительной фирмы за хищение 550 млн рублей
11.04.2026 16:07:30 | Коммерсантъ

Профессор Малинен назвал Россию мировым лидером в разработке гиперзвуковых ракет
11.04.2026 16:06:59 | Life.ru

Трамп высказался об исходе переговоров в Исламабаде
11.04.2026 16:06:47 | Lenta.ru

Началось объявленное Владимиром Путиным пасхальное перемирие
11.04.2026 16:06:00 | Российская Газета

Переговоры США и Ирана в Исламабаде проходят при посредничестве Пакистана
11.04.2026 16:05:48 | ТАСС

Смертельная авария с «Газелью» и Jaguar в Москве попала на видео
11.04.2026 16:04:56 | Life.ru

Double Fine Productions запустила открытое бета-тестирование многопользовательского гончарного боевика Kiln
11.04.2026 16:04:49 | PlayGround.ru

Guardian раскрыла, как Polymarket зарабатывает на войнах и убийствах
11.04.2026 16:04:00 | Российская Газета

Эррол Маск объяснил, почему лидеров США по-настоящему мало волнует остальной мир
11.04.2026 16:03:00 | ТАСС

Свобода слова по-русски: Глава RT в Ливане поразил Такера Карлсона откровением
11.04.2026 16:01:51 | Life.ru

Началось объявленное Путиным пасхальное перемирие
11.04.2026 16:00:59 | ТАСС

"Крылья Советов" и "Ахмат" сыграли вничью в матче РПЛ
11.04.2026 15:59:21 | ТАСС

ВСУ FPV-дроном ударили по авто под Купянском
11.04.2026 15:58:54 | ТАСС

Чемпион «регулярки» второй раз подряд обыграл «Торпедо» в плей-офф КХЛ
11.04.2026 15:58:42 | РБК

В Ормузский пролив вошли два китайских супертанкера
11.04.2026 15:58:24 | РБК

Дуров сделал заявление о работе Telegram в России
11.04.2026 15:57:00 | Lenta.ru

Названа причина смерти актера из сериала «Следствие ведут знатоки»
11.04.2026 15:56:41 | Lenta.ru

Axios утверждает, что несколько кораблей ВМС США прошли через Ормузский пролив
11.04.2026 15:56:35 | ТАСС

Российские ватерполисты не смогли выйти в полуфинал Кубка мира
11.04.2026 15:56:02 | РБК

"Металлург" увеличил преимущество в четвертьфинале плей-офф КХЛ с "Торпедо"
11.04.2026 15:55:55 | ТАСС

Что известно о стартовавших переговорах США и Ирана
11.04.2026 15:54:00 | Российская Газета

Владелец компании по авторским правам попался на краже чужого фото
11.04.2026 15:53:29 | Life.ru

Иран обозначил список красных линий в переговорах с США
11.04.2026 15:53:00 | Lenta.ru

Медведев стал главным редактором учебников по обществознанию
11.04.2026 15:52:54 | ТАСС

Президент Ирака Рашид снял свою кандидатуру с выборов главы государства
11.04.2026 15:51:36 | Life.ru

В Курской области в ДТП с грузовиком погибли два человека
11.04.2026 15:50:57 | ТАСС

Минэнерго Сербии назвал главной целью переговоров по NIS отмену санкций США
11.04.2026 15:50:54 | ТАСС

Бойцы "Хезболлах" подбили два израильских танка Merkava на юге Ливана
11.04.2026 15:48:47 | ТАСС

Все новости

ВСЕ НОВОСТИ

ПИШИТЕ

Техническая поддержка проекта ВсеТут

info@vsetut.pro

Copyright © 2026 - vsetut.pro