ddps-lab / cloud-usage

MIT License
1 stars 1 forks source link

S3 아카이빙 자동화 문제 해결 #53

Closed Kim-Yul closed 4 weeks ago

Kim-Yul commented 1 month ago

8월 6일에 Standard 타입에서 Glacier 타입으로 아카이빙이 자동화 되어야 했을 시스템이 에러로 인해 작동하지 않았습니다. 문제 해결 및 정상적으로 자동화될 수 있도록 수정하는 작업을 진행합니다.

image

Lambda 함수로 ec2 를 실행시키는 데, ami 와 snapshot 삭제를 진행하면서 기존의 ami 를 건들였던 것 같습니다. 이로 인해 변경된 ami id 를 인자로 전달하지 않은 탓에 에러가 발생하였고, 시스템이 정상 수행되지 않았습니다. 에러를 수정하고, 정상 수행되도록 문제를 해결하고자 합니다.

기존 id : ami-0a287f395304484b1 변경 id : ami-0d598c34f28d018eb

kmu-leeky commented 1 month ago

유림아 확인 잘했다. 고생했다!

Kim-Yul commented 1 month ago

실행 결과 정리

image

위의 경우, Glacier로 옮겨진 버킷과 사이즈를 표시하고 있습니다. 다만, ClientError가 발생하는 3개의 버킷과 사이즈가 정말 작은 버킷은 이전 값이 중복되어 나타나는 것으로 확인됩니다. 이 부분은 수정할 예정입니다.

s3 관리를 안전하게 마무리합니다. 라는 코멘트의 경우 아카이빙을 진행하는 인스턴스가 정상적으로 종료되었을 경우 전달됩니다.

기존 코드에서의 변경 사항

기존 방식에서는 아카이빙을 진행하는 인스턴스가 온디멘드 타입이었습니다. 스팟 인스턴스를 본격적으로 사용하기 이전이었기에 해당 부분 수정하였습니다. 현재는 스팟 인스턴스로 켜지게 코드를 수정하였으며, 자동화 코드를 통해 자동 종료되는 것을 확인하였습니다.

참고 : boto3 문서

Kim-Yul commented 1 month ago

54 코드 수정하였습니다.

해당 사항은 aws 내에 있는 snapshot 에도 반영하였으며, 새롭게 ami 를 생성하였습니다.

새로 만든 ami id 는 ami-063fffa43fba5ac76 이며, lambda에도 반영해두었습니다.

자동화 문제는 해결하였으며 더 발견된 에러가 없어서 현재 이슈는 확인 후 닫으려고 합니다. 새로운 이슈 발생 시 10월에 다시 추적하도록 하겠습니다.