광고 시스템 장애 회고 — 공유 의존성과 단일 장애점

외부 이벤트로 광고 트래픽이 급증하면서 cascading failure 가 발생했다. 진짜 문제는 필터링 컴포넌트가 단일 장애점이었고 fallback 까지 그 위에 묶여 있어서 한 곳의 무너짐이 양쪽의 동시 붕괴로 이어졌다는 것이었다. 개선은 세 갈래 — fallback 의 의존 제거(독립화), 필터링 컴포넌트에 Rate Limit(보호), 그리고 런타임 재검토(처리량 증대).

2025년 2월 13일 · 약 6분 읽기