Il n'y a plus trop de bizarreries, mais il reste un petit souci sur les données API du CD72 puisque le fix est dans cette PR ^^
Comme d'habitude, il vaut vraiment mieux relire dans l'ordre et commit par commit, ils sont théoriquement tous atomiques et indépendants. Les 4 premiers sont plutôt utilitaires/nettoyage.
Le modèle int_quality__stats est "intermédiaire" car:
ce n'est pas une donnée finale au sens "des consommateurs vont l'utiliser"
les modèles dans marts ont une obligation de respect d'un contrat de données
Si cela convient dans les grandes lignes, je propose les étapes suivantes:
ajout de colonnes supplémentaires pour le décompte des données importantes (contacts, adresse, etc)
historisation (faisable en quelques minutes via snapshot sur la colonne de date)
ajout en étape finale au DAG main (ou au DAG import_data_inclusion_api pour que les données API soient celles du jour et pas J-1?)
Première version d'un modèle de "qualité" qui permet d'afficher la qualité des données.
Output actuel sur les données du 22 Juillet:
Il n'y a plus trop de bizarreries, mais il reste un petit souci sur les données API du CD72 puisque le fix est dans cette PR ^^
Comme d'habitude, il vaut vraiment mieux relire dans l'ordre et commit par commit, ils sont théoriquement tous atomiques et indépendants. Les 4 premiers sont plutôt utilitaires/nettoyage.
Le modèle
int_quality__stats
est "intermédiaire" car:marts
ont une obligation de respect d'un contrat de donnéesSi cela convient dans les grandes lignes, je propose les étapes suivantes:
import_data_inclusion_api
pour que les données API soient celles du jour et pas J-1?)