codeforjapan / BirdXplorer

7 stars 1 forks source link

ETLにおけるデータの差分取得のインフラをCDKにする #109

Open yu23ki14 opened 2 months ago

yu23ki14 commented 2 months ago

改善詳細 / Details of Improvement

ETLを定期実行にして差分取得するための設計とCDKの実装を行う。 基本的にはCommunityNotesの更新頻度に合わせておこなう。更新日時が日によって違ったりするので、スクリプト自体は4時間に1回回すような方法でもいいかもしれない。ただ、Twitterのデータが1分に1件しか取れないので、例えば素直に4時間ごとに実行した場合240個しか取得できず終わっていないのにまた走ってしまう可能性があるのでそれを防ぐ必要がある。

yu23ki14 commented 1 month ago

外部からの接続はなし完全Isorated