Операция выполнена!
Закрыть
Хабы: Блог компании Ozon Банк

Retry и timeout кажутся базовыми механизмами отказоустойчивости.
Не прошел запрос — повторим. Ответ не пришел за 500 мс — оборвем. Кажется, что этого достаточно, чтобы система стала надежнее.

На практике в распределенных системах retry и timeout могут работать наоборот. Когда сервис уже деградирует, повторные запросы не сглаживают проблему, а усиливают ее. Клиенты начинают ретраить одновременно, нагрузка растет, и сбой распространяется дальше по цепочке зависимостей.

В этой статье разберем, как retry создает каскадные отказы, почему таймауты могут ухудшить ситуацию и какие механизмы — backoff, jitter и circuit breaker — помогают этого избежать

Читать далее
Читайте также
НОВОСТИ

ПИШИТЕ

Техническая поддержка проекта ВсеТут

info@vsetut.pro