Closed JasonYoo1995 closed 9 months ago
카카오 챗봇 관련해서 경험한 이슈입니다.
[이슈 내용]
[상세 내용]
1. Gentle request를 짜기 어려웠다.
2. 비용을 극한으로 아껴야 했다.
당시 일 배치 구조는 Amazon EventBridge + AWS Lambda(Springboot) + Amazon DynamoDB 서버리스 아키텍처입니다.
[조치 내용]
결국
이벤트 기반 구성으로 Request and Forget 패턴으로 일 배치 구성
AWS가 제공하는 서버리스 솔루션으로 트래픽 확장 대비
매일 메트릭 확인하면서 성공률이 만족스럽지 않으면, 수동으로 트리거
특정 일자에 선착순 이벤트를 진행한다든지, 아니면 기념일같은 날일 경우 트래픽이 급증하곤 합니다. 특정 일자 선착순 이벤트인 경우가 좀 더 적합할 거 같네요.
아직 서버가 완전히 뻗어버리거나, 크리티컬한 장애 경험은 없습니다만, 한번 기록해보겠습니다!
어떤 문제가 발생하셨는지?
어떻게 대처하셨는지?
해당 문제가 발생할 것을 예상하여, 사전에 안정성을 갖춰놓은 것이 있다면, 어떤 식으로 갖춰놓으셨는지?
질문
A. 얼마 전에 KT IDC-AWS 서울/도쿄에 latency 및 loss가 1시간 이내로 발생하였는데요 이로 인해 저희 시스템도 영향을 받게 되어 비상 근무를 섰습니다
여러분의 시스템은 이런 상황이 발생했을 때
B. 저희 시스템은 트래픽이 많지 않아서, 트래픽이 급증하는 상황을 경험해보지 못했는데요 여러분은 트래픽이 급증하는 상황을 겪은 적이 있으신가요?
있으시다면
연관 챕터
6
@caffeine-library/readers-release-everything