Open Thesauruv opened 6 months ago
Ci-dessous une analyse rapide du dashboard existant avec le prisme suivant : si on utilise une source de données data.gouv.fr vs le dump de CKAN existant, quels seraient les solutions et impacts ?
On considère que la solution Metabase continue à être utilisée.
Plusieurs possibilités :
Ce point reste à creuser notamment en fonction des fonctionnalités cibles, des ressources utilisées pour le projet et du calendrier, voire de la gouvernance de l'outil pour la piste direct Mongo. La piste synchronisation d'un référentiel dédié me parait la plus naturelle.
Ci-dessous une analyse des indicateurs présents sur le dashboard existant et quelles correspondances on peut trouver vers des attributs existants ou non de data.gouv.fr.
progress
en ISOadms:status
À terme, ce filtre pourra être lié aux bouquets de données (et donc aux cas d’usage) ecologie.data.gouv.fr. En effet, les indicateurs devront pouvoir être analysés sur un bouquet de données.
dct:contactPoint
(au moins)dct:accessRights
(extras)Une réflexion que je me suis faite hier : un tel dashboard branché sur data.gouv.fr pourra aussi nous servir en interne pour suivre l'évolution de la qualité et de la quantité des moissonnages.
Dans les possibilités d'alimentation, j'ajouterais aussi le branchement en direct à un dump du catalogue, en csv (ou parquet si ça se confirme côté data.gouv ?). Metabase possède plusieurs connecteurs comme Dremio ou DuckDB qui peuvent directement travailler sur de tels formats. Vu le volume de données les perfs pourraient être largement suffisantes. En tous cas à envisager pour POC ?
Ticket en avance de phase par rapport aux priorités actuelles.
Points d'entrée :