ChallengeClub / tetris_score_server

tetris_score_server for https://github.com/seigot/tetris
MIT License
2 stars 6 forks source link

一件の評価実行時間が長い時にオートスケールで、プロセスが終わらなくなる #75

Closed EndoNrak closed 1 year ago

EndoNrak commented 1 year ago

症状

原因

追記 image

EndoNrak commented 1 year ago

解消方法 オートスケーリング用のアラーム内容を適正化する

現状

変更案

EndoNrak commented 1 year ago

実現手段案

  1. ApproximateNumberOfMessagesVisibleApproximateNumberOfMessagesNotVisibleの和が1以上ならalarm、0ならOKであるので数式に基づくカスタムアラームを作る(https://docs.aws.amazon.com/ja_jp/AmazonCloudWatch/latest/monitoring/Create-alarm-on-metric-math-expression.html
  2. ApproximateNumberOfMessagesVisibleApproximateNumberOfMessagesNotVisibleをそれぞれ監視し、1以上である場合にalarm状態になるアラームをそれぞれ作成。それら二つの複合アラームを作る(https://docs.aws.amazon.com/ja_jp/AmazonCloudWatch/latest/monitoring/Create_Composite_Alarm.html
EndoNrak commented 1 year ago

アラームの数が一つで済むので、1を採用する

EndoNrak commented 1 year ago

スケーリングする幅が0と1だからこれでOKだが、より複雑なときには対応できていない気がする スケールインするときにタスクの中身が終わるのを待てるようにするのが理想かも