Хабы: Блог компании Яндекс, Блог компании Yandex Cloud & Yandex Infrastructure, Высокая производительность, Сетевые технологии, Инженерные системы
Привет, меня зовут Руслан Савченко, я руководитель службы разработки динамических таблиц в Yandex Infrastructure и преподаватель в Школе анализа данных. Сегодня я поделюсь актуальными инсайтами о том, как ломаются большие системы и как их траблшутить. Думаю, это будет полезно разработчикам и студентам, которые интересуются Site Reliability Engineering. Вообще, мало где сейчас обучают SRE, хотя в индустрии такие задачи очень востребованы.
В основе статьи — материалы SRE Week, открытого интенсива ШАДа по работе с большими нагруженными системами.
Читать далее