Хабы: Математика, Системное администрирование, Программирование
Не так давно столкнулся с алертом, который работает следующим образом: раз в 10 секунд пробер делает HTTP-запрос до другого сервиса и увеличивает метрику со счетчиком ошибок, в случае провала. Если 6 раз подряд происходят ошибки - алерт активизируется и привлекает внимание человека. В моем конкретном случае за одним DNS именем целевого сервиса скрывается 10 различных IP-адресов, и в какой-то момент 2 из-них стали отвечать чуть дольше обычного, приводя к периодическому срабатыванию данного алерта.
Как посчитать вероятность цепочки событий?