Closed EndoNrak closed 1 year ago
解消方法 オートスケーリング用のアラーム内容を適正化する
現状
ApproximateNumberOfMessagesVisible
(sqsに取得可能な状態で入っているキューの数)が1以上ならalarm
、0ならOK
ApproximateNumberOfMessagesNotVisible
(処理中のキューの数)は考慮していない変更案
ApproximateNumberOfMessagesVisible
とApproximateNumberOfMessagesNotVisible
がともにゼロの時はOK
、それ以外はalarm
実現手段案
ApproximateNumberOfMessagesVisible
とApproximateNumberOfMessagesNotVisible
の和が1以上ならalarm
、0ならOK
であるので数式に基づくカスタムアラームを作る(https://docs.aws.amazon.com/ja_jp/AmazonCloudWatch/latest/monitoring/Create-alarm-on-metric-math-expression.html)ApproximateNumberOfMessagesVisible
とApproximateNumberOfMessagesNotVisible
をそれぞれ監視し、1以上である場合にalarm
状態になるアラームをそれぞれ作成。それら二つの複合アラームを作る(https://docs.aws.amazon.com/ja_jp/AmazonCloudWatch/latest/monitoring/Create_Composite_Alarm.html)アラームの数が一つで済むので、1を採用する
スケーリングする幅が0と1だからこれでOKだが、より複雑なときには対応できていない気がする スケールインするときにタスクの中身が終わるのを待てるようにするのが理想かも
症状
原因
追記