MTES-MCT / sparte

MIT License
6 stars 1 forks source link

Mise en place d'un outil ETL pour automatiser les calculs #536

Closed alexisig closed 1 month ago

alexisig commented 1 month ago

Situation

La moitié des calculs sont fait en local (ce qui a été fait dans cette US : #188) et le reste en production. Pour chaque chargement de nouveau département OCS GE, plusieurs actions et vérificiations manuelles sont nécessaires, puis de nombreux calculs ont lieu en production (ce qui implique une période de maintenance).

Solution

Extraire tous ces calculs sur un ETL installé sur un serveur tier, et charger les données directement pré-caculées

alexisig commented 1 month ago

@inesdartiguenave @Phil-Loriot Au vu de nos besoins en terme de calcul et de croisement de données, je pense que cette tâche devient un pre-requis pour industrialiser notre process de livraison de données. Ce serait un bon chantier d'été et permettrait de livrer un nouveau département avec simplement les URLS des shapefiles de l'IGN en entrée.

Ca impliquerait :

L'effort total de mise en place d'un tel système + l'intégration des 10 nouveaux départements (avec la nouvelle méthode de calcul de l'artif) serait à mon sens plus faible que le même travail sans la mise en place de ce système.

Ca impliquerait en contrepartie d'accepter de livrer ces départements et la nouvelle méthode de calcul de l'artif une fois que cette brique technique est prête.

alexisig commented 1 month ago

En cours : déploiement de l'infra sur https://www.astronomer.io/

C'est l'équivalent de scalingo (un PAAS) mais spécifique à l'ETL airflow