gip-inclusion / data-inclusion

data·inclusion aggrège les données de l'insertion sociale et professionnelle
https://api.data.inclusion.beta.gouv.fr/api/v0/docs
MIT License
6 stars 1 forks source link

feat(core): daily backup for datawarehouse bdd #315

Closed hlecuyer closed 2 weeks ago

hlecuyer commented 2 weeks ago

Voila encore une version naive d'un backup possible de datawarhouse. Je l'ai test en local, il reste un peu d'ajustement pour que ca fonctionne en prod.

La plus grosse limitation que je vois, c'est qu'on utilise le psql d'airflow pour executer le dump de la base postgres. Du coup idealement il faudrait qu'on ai les meme versions a minima donc ca veux dire changer la version de bdd d'airflow aussi...

La deuxieme limitation, c'est qu'on fait tourner le backup directement sur le container airflow, et si un moment ca scale mal, ca fait planter le reste des traitements.

Si vous avez une autre idee en tete je suis preneur...