etalab / rncs_worker_api_entreprise

API pour récupérer et mettre à disposition les données du Répertoire National du Commerce et des Société
https://entreprise.data.gouv.fr
MIT License
23 stars 13 forks source link

Trop de responsabilités dans les jobs d'import #122

Open brindu opened 5 years ago

brindu commented 5 years ago

Le job d'import a aujourd'hui trop de responsabilités : il ne devrait qu'appeler l'opération d'import (Load), gérer l'orchestration de la suite de l'import en fonction du résultat et tout ce qui est job related (queue de retry, etc).

La transaction est aujourd'hui au tout début de la chaine d'import alors que l'opération Load fait "beaucoup" de chose avant de persister la donnée en base (lecture du disque, unzip, parsing des noms de fichier, ...). Elle doit être redescendue au moment de l'import des données en base

L'opération d'import devrait s'occuper des mises à jour de l'état de l'import : LOADING, COMPLETED, ERROR ce qui n'est pas possible tant que l'exécution de l'opération est entièrement encadrée par la transaction.