ecolabdata / ecospheres

Portail des données de la transition écologique et de la cohésion des territoires
https://ecologie.data.gouv.fr
2 stars 0 forks source link

Spec gestion de patrimoine basée sur ecologie.data.gouv #111

Open Thesauruv opened 6 months ago

Thesauruv commented 6 months ago

Ticket en avance de phase par rapport aux priorités actuelles.

Points d'entrée :

abulte commented 3 months ago

Ci-dessous une analyse rapide du dashboard existant avec le prisme suivant : si on utilise une source de données data.gouv.fr vs le dump de CKAN existant, quels seraient les solutions et impacts ?

Alimentation du dashboard

On considère que la solution Metabase continue à être utilisée.

Plusieurs possibilités :

Ce point reste à creuser notamment en fonction des fonctionnalités cibles, des ressources utilisées pour le projet et du calendrier, voire de la gouvernance de l'outil pour la piste direct Mongo. La piste synchronisation d'un référentiel dédié me parait la plus naturelle.

Mapping des métadonnées

Ci-dessous une analyse des indicateurs présents sur le dashboard existant et quelles correspondances on peut trouver vers des attributs existants ou non de data.gouv.fr.

abulte commented 3 months ago

Une réflexion que je me suis faite hier : un tel dashboard branché sur data.gouv.fr pourra aussi nous servir en interne pour suivre l'évolution de la qualité et de la quantité des moissonnages.

streino commented 3 months ago

Dans les possibilités d'alimentation, j'ajouterais aussi le branchement en direct à un dump du catalogue, en csv (ou parquet si ça se confirme côté data.gouv ?). Metabase possède plusieurs connecteurs comme Dremio ou DuckDB qui peuvent directement travailler sur de tels formats. Vu le volume de données les perfs pourraient être largement suffisantes. En tous cas à envisager pour POC ?