Open yu23ki14 opened 2 months ago
ETLを定期実行にして差分取得するための設計とCDKの実装を行う。 基本的にはCommunityNotesの更新頻度に合わせておこなう。更新日時が日によって違ったりするので、スクリプト自体は4時間に1回回すような方法でもいいかもしれない。ただ、Twitterのデータが1分に1件しか取れないので、例えば素直に4時間ごとに実行した場合240個しか取得できず終わっていないのにまた走ってしまう可能性があるのでそれを防ぐ必要がある。
外部からの接続はなし完全Isorated
改善詳細 / Details of Improvement
ETLを定期実行にして差分取得するための設計とCDKの実装を行う。 基本的にはCommunityNotesの更新頻度に合わせておこなう。更新日時が日によって違ったりするので、スクリプト自体は4時間に1回回すような方法でもいいかもしれない。ただ、Twitterのデータが1分に1件しか取れないので、例えば素直に4時間ごとに実行した場合240個しか取得できず終わっていないのにまた走ってしまう可能性があるのでそれを防ぐ必要がある。
それを前回のものをロードして再開できるようにS3にSQLiteの静的ファイルを保存するようにするといいかもしれない。