ecolabdata / ecospheres-metadata

Visualisation des métadonnées moissonnées dans Ecosphères
3 stars 1 forks source link

Maturité #11

Closed johanricher closed 9 months ago

johanricher commented 10 months ago

User story

Je suis Un gestionnaire de catalogue. Un administrateur ministériel des données.

Je veux En tant que gestionnaire, j'ai un rôle de coordination. Je souhaite apprécier mon patrimoine de données au regard des besoins de standardisation et d'agrégation, d'ouverture ou plus simplement de sélection des jeux de données les plus pertinents pour mon usage. Je souhaite pouvoir évaluer la qualité de mon patrimoine et en promouvoir l'amélioration :

Je peux [Par exemple depuis l'univers PPRN #5 (base de travail de l'itération 2)]

[Distinguer mes jeux de données] Identifier la part de jeux de données matures à l'utilisation (et donc les jeux de données en cours d'élaboration ou dépréciés).

Besoins associés (du plus au moins évident) 6- Pouvoir certifier de la validité d'un jeu de donnée

Implémentation

Superset chart type: Histogram

Lien vers l'outil

Métadonnées utilisées

Le concept utilisé pour cette métadonnée est "Status" dans le vocabulaire ADMS. Les valeurs à récupérer sont des URI, dont on veut afficher le libellé (par exemple "Completed").


flowchart TD

    Dataset[Dataset]
    DatasetStatus[http://www.w3.org/ns/adms#status]

    Dataset --> DatasetStatus

Remarques

Après première production de l'indicateur

Comment l'indicateur en l'état répond aux besoins ?

L'indicateur est très important (entretiens utilisateurs). Néanmoins, il est aujourd'hui peu rempli et les pratiques de remplissage de l'indicateur au sein du pôle ministériel sont peu documentées (incertaines).

Comment pourrait-il être amélioré (préconisations) ?

Bien que peu rempli, l'indicateur est intéressant pour les utilisateurs, il s'agit alors de le laisser en l’état dans l'outil et d'inciter les producteurs à l'utiliser plus largement.

johanricher commented 10 months ago

@qloridant A vérifier : Est-ce qu'il y a dans le catalogue d'autres valeurs que COMPLETED renseignées pour le champ status ?

Thesauruv commented 10 months ago

@johanricher @qloridant Ci-dessous, histogramme réalisé à partir de la métadonnée "adms:status" sur l'ensemble des datasets de l'environnement "integration". D'autres valeurs que l'attribut COMPLETED sont bien disponibles. Les catégories sont potentiellement à regroupées ("UnderDevelopment" et "onGoing"). Graphe disponible ici, en slide 14/18 image

Thesauruv commented 10 months ago

@johanricher je garderais en abscisse le niveau de détail des métadonnées disponibles : "on going", "completed", etc. Concernant l'interprétation de ces valeurs, ce sera à reboucler notamment avec Benoît.

johanricher commented 10 months ago

Entendu, j'ai mis à jour le ticket merci. :+1: On explicitera le sens de ce champ et des différentes valeurs renseignées pour contextualiser l'indicateur.

qloridant commented 10 months ago

Implémentation disponible sur Superset (prenant en compte le filtre sur l'univers PPRN) :

image

@johanricher si tu ne vois rien à rajouter, je fermerai le ticket

johanricher commented 10 months ago

Top @qloridant super taf ! Lien vers la visualisation de l'indicateur dans l'outil.

Je laisse @Thesauruv valider avant qu'on ferme le ticket.

qloridant commented 10 months ago

Visible ici ou depuis le dashboard

Thesauruv commented 10 months ago

Supprimer la valeur "None" de l'histogramme, remplacer par un pourcentage en dessous du graphe.

Thesauruv commented 10 months ago

Pour ce type de graphe, je vois le besoin d'expliciter le sens des différents attributs ; il s'agit notamment de répondre à des questions du type "quelle différence entre 'On Going' et 'Under Development' ?". Certains de ces attributs proviennent de vocabulaires contrôlés, les URI qui leurs sont associés doivent présenter une définition du vocabulaire.

Par exemple, dans http://publications.europa.eu/resource/authority/dataset-status/COMPLETED : <skos:definition xml:lang="en">This dataset is considered to be complete, it holds all information that is intended.</skos:definition>

Certains vocabulaires proviennent d'un registre interne, je vais demander à Benoît des précisions : https://registre.data.developpement-durable.gouv.fr/plume

Thesauruv commented 9 months ago

@clementmandron où avez vous trouvé toutes ces définitions ?

Completed : le jeu de données contient toutes les données qu'il doit contenir On Going : le jeu de données est encore à alimenter pour contenir toutes les données qu'il doit normalement contenir Historical Archive : le jeu de données est une archive d'une ancienne version, qui peut différer dans sa structure et son contenu par rapport aux versions 'Completed' et 'On Going' Historical Archive : le jeu de données est une archive d'une ancienne version Obsolete : le jeu de donnée est obsolete, il est déconsillé de l'utiliser Requierd : le jeu de données est obligatoire pour certains usages Under Development : la structure du jeu de données est encore instable et va évoluer Planned : la complétion du jeu de données est planifiée

Attention au duplicat de Historical Archive.

Thesauruv commented 9 months ago

Le vocabulaire contrôlé ADMS (Asset Description Metadata Schema) définit bien les entrée suivantes :

        <skos:hasTopConcept rdf:resource="http://purl.org/adms/status/Completed"/>
        <skos:hasTopConcept rdf:resource="http://purl.org/adms/status/Deprecated"/>
        <skos:hasTopConcept rdf:resource="http://purl.org/adms/status/UnderDevelopment"/>
        <skos:hasTopConcept rdf:resource="http://purl.org/adms/status/Withdrawn"/>
Thesauruv commented 9 months ago

Les autres propriétés proviennent visiblement de la norme ISO19139, en particulier : image

clementmandron commented 9 months ago

@Thesauruv merci Les liens ADMS (Asset Description Metadata Schema) que tu envoies ne donnent pas accès à une définition ou je me trompe ?

Je vais utiliser celles de l'ISO Pour le moment, c'était des définitions que j'ai moi-même ajoutées (sans source) pour le test.

La principale question de Stéphane Rolle était de savoir qui renseigne ce statut, ce qu'il voulait dire.

J'ai l'impression que c'est rempli par le producteur de données. Je me trompe ? Si c'est ça, je vais compléter l'astuce de lecture.

Thesauruv commented 9 months ago

Dans le tableau de bord, reste à actualiser les définitions à partir de celles d'ISO19139 et on pourra fermer le ticket.