etalab / transport-site

Rendre disponible, valoriser et améliorer les données transports
https://transport.data.gouv.fr
184 stars 28 forks source link

Historiser le nombre de lignes de la consolidation IRVE dans stats_history #3963

Open vdegove opened 1 month ago

vdegove commented 1 month ago

On voudrait avoir un historique du nombre de lignes dans le fichier.

thbar commented 1 month ago

On a eu besoin de cette information assez souvent, c'est vraiment rentable je pense de l'intégrer quelque part.

Idéalement metabase-compatible, mais aussi affichable sur le site (rapports).

AntoineAugusti commented 1 month ago

Plusieurs jobs écrivent des données dans geo_data.

Peut-être adapter StatsHandler pour requêter ces données et écrire la bonne (clé, valeur) ?

thbar commented 1 month ago

Voir aussi le nettoyage réalisé ici (qui impacte positivement geo_data):

thbar commented 1 month ago

Suggestion (redite de Mattermost): faire en sorte d'avoir un nommage assez agnostique (du type "row_count" et référençant peut-être l'id de ressource directement), comme ça on pourrait faire des analyses un peu systématiques à terme.

vdegove commented 1 month ago

@thbar histoire d’être clair : tu veux que dans stats_history, je rajoute des lignes dont la colonne "metric" contienne par exemple la valeur row_count_geo_data_118 au lieu de row_count_geo_data_irve ?

thbar commented 1 month ago

@vdegove ça pourrait être namespacé ou un peu comme suit: row_count:resource:118 (différent de ce qui se fait actuellement, mais similaire à ce qui se fait ailleurs dans l'application)

AntoineAugusti commented 1 month ago

On a un peu de namespace de metric existant dans cette table.

image

Je serais plus en faveur d'avoir un slug plutôt qu'un ressource ID pour faciliter les requêtes et pour assurer une continuité du nommage si on change de ressource, ce qui arrive pour les bases nationales

vdegove commented 1 month ago

Ok, je réfléchis et je vous propose un truc alors (je suis en train de travailler dessus, c’était mon petit bonbon de la journée).