ecolabdata / ecospheres-metadata

Visualisation des métadonnées moissonnées dans Ecosphères
3 stars 1 forks source link

Organisations propriétaires #7

Closed johanricher closed 10 months ago

johanricher commented 12 months ago

User story

Je suis Un gestionnaire de catalogue. Un administrateur ministériel des données.

Je veux En tant que gestionnaire, j'ai un rôle de coordination. Je souhaite apprécier mon patrimoine de données au regard des besoins de standardisation et d'agrégation, d'ouverture ou plus simplement de sélection des jeux de données les plus pertinents pour mon usage. Je souhaite pouvoir évaluer la qualité de mon patrimoine et en promouvoir l'amélioration :

Je peux [Par exemple depuis l'univers PPRN #5 (base de travail de l'itération 2)]

[Distinguer mes jeux de données] Visualiser la distribution de mes jeux de données selon les producteurs.

Besoins associés (du plus au moins évident)

Implémentation

Superset chart type: Histogram

Métadonnées utilisées

Remarques

Après première production de l'indicateur

Comment l'indicateur en l'état répond aux besoins ?

L’indicateur permet de comprendre la distribution des jeux de données par organisation propriétaire.

Filtré sur un périmètre, il permet de savoir vers qui diriger les actions d’amélioration des données et des métadonnées (en lien avec l’indicateur sur les points de contacts).

Il permet aussi de se rendre compte de la concentration ou non de la propriété des jeux de données, et comprendre ainsi quel propriétaire pourrait être ciblé en priorité.

Comment pourrait-il être amélioré (préconisations) ?

Il s’agit de bien documenter, dans l’outil, ce que recouvre la notion de propriétaire d’un jeu de données, par rapport à d’autres métadonnées (notamment points de contact “dataset” et points de contact “catalogue”). Pour connaître les pratiques de saisie, on peut se référer au guide de saisie des métadonnées INSPIRE.

Thesauruv commented 12 months ago

J'ai l'impression que la métadonnée dct:creator n'est pas exposée. Nous pouvons en approximation s'appuyer sur la métadonnée dct:rights_holder qui définit le propriétaire de la donnée.

Thesauruv commented 11 months ago

Point de vigilance, il me semble y avoir une erreur dans l'écriture de la propriété dcat:rights_holder (par exemple, ne respecte pas la convention camelCase), potentiellement un bug dans la réexposition du côté d'Ecosphères.

qloridant commented 11 months ago

Les champs creator et right_holders sont exposés et renvoient des objects Organizations.

Je propose donc d'utiliser le champs rights_holder pour ce paramètre J'ai réalisé un graphique qui va dans ce sens, disponible ici

Il va falloir se décider sur un affichage. Pour le moment nous avons trop de catégories pour un graphique. Le graph est assez peu lisible

Thesauruv commented 11 months ago

@qloridant bien d'accord avec toi sur le manque de lisibilité du graphie. Concernant les histogrammes, il est bon de manière générale de classer les labels par ordre décroissant. Ici, une alternative serait d'utiliser un pie chart, avec la même problématique d'ordonner les données (voir screen shot ci-dessous).

Thesauruv commented 11 months ago

Image

Thesauruv commented 11 months ago

Concernant la métadonnée "rights_holder", comme indiqué plus haut, l'écriture de la propriété est erronée par rapport à la définition dans GeoDCAT-AP dct:rightsHolder, je propose qu'on rajoute un #TODO dans le code et d'un log warning pour préciser que la fonction du DCAT reader devra être modifiée.

Par ailleurs, la définition exacte de dct:rightsHolder associé à un dataset dans la documentation de GeoDCAT-AP précise :

This property refers to an Agent (organisation) holding rights on the Dataset.

On s'éloigne bien de la définition de dct:creator :

This property refers to an Agent (organisation) holding rights on the Dataset.

Je propose de renommer le ticket "Détenteur des Droits"

Thesauruv commented 11 months ago

Je viens de changer la visualisation par un camembert dans Metabase :

Image

Thesauruv commented 10 months ago

Je vois une incohérence entre la table et le camembert (on ne retrouve pas la DDT du Gers en top position) et le tableau inclut une ligne associé au nombre total de données :

Image

Thesauruv commented 10 months ago

En filtrant sur "ZNIEFF", le camembert réexpose également les valeurs nulles :

Image

qloridant commented 10 months ago
Thesauruv commented 10 months ago

Je viens de renommer "détenteur des droits" par "propriétaire", dans le ticket et dans metabase.

qloridant commented 10 months ago

Suppression de l'histogramme

Doc supprimée : `ℹ️ Astuce de lecture :

12% des jeux de données [[issus de l'univers pré-formaté 🖼️ {{Univers}}]] [[issus de la recherche 🔎 "{{moteur_de_recherche}}"]] [[issus du catalogue 📙 "{{catalogue}}"]] sont détenus par la DDT du Gers (le nombre effectif peut varier selon les filtres). En dessous de 2,5% de jeux de données détenus, un propriétaire est classé dans "Autre". `