caffeine-library / release-everything

'Release의 모든 것'을 읽는 스터디
3 stars 0 forks source link

[question] 여러분의 시스템에서 균열이 발생한 적이 있나요? #10

Closed JasonYoo1995 closed 9 months ago

JasonYoo1995 commented 9 months ago

질문

A. 얼마 전에 KT IDC-AWS 서울/도쿄에 latency 및 loss가 1시간 이내로 발생하였는데요 이로 인해 저희 시스템도 영향을 받게 되어 비상 근무를 섰습니다

여러분의 시스템은 이런 상황이 발생했을 때

B. 저희 시스템은 트래픽이 많지 않아서, 트래픽이 급증하는 상황을 경험해보지 못했는데요 여러분은 트래픽이 급증하는 상황을 겪은 적이 있으신가요?

있으시다면

연관 챕터

6


@caffeine-library/readers-release-everything

binchoo commented 9 months ago

카카오 챗봇 관련해서 경험한 이슈입니다.

[이슈 내용]

[상세 내용]

  1. Gentle request를 짜기 어려웠다.
  2. 비용을 극한으로 아껴야 했다.

당시 일 배치 구조는 Amazon EventBridge + AWS Lambda(Springboot) + Amazon DynamoDB 서버리스 아키텍처입니다.

[조치 내용]

결국

kth990303 commented 9 months ago

특정 일자에 선착순 이벤트를 진행한다든지, 아니면 기념일같은 날일 경우 트래픽이 급증하곤 합니다. 특정 일자 선착순 이벤트인 경우가 좀 더 적합할 거 같네요.

아직 서버가 완전히 뻗어버리거나, 크리티컬한 장애 경험은 없습니다만, 한번 기록해보겠습니다!