Closed johanricher closed 10 months ago
J'ai l'impression que la métadonnée dct:creator
n'est pas exposée. Nous pouvons en approximation s'appuyer sur la métadonnée dct:rights_holder
qui définit le propriétaire de la donnée.
Point de vigilance, il me semble y avoir une erreur dans l'écriture de la propriété dcat:rights_holder (par exemple, ne respecte pas la convention camelCase), potentiellement un bug dans la réexposition du côté d'Ecosphères.
Les champs creator et right_holders sont exposés et renvoient des objects Organizations.
Je propose donc d'utiliser le champs rights_holder pour ce paramètre J'ai réalisé un graphique qui va dans ce sens, disponible ici
Il va falloir se décider sur un affichage. Pour le moment nous avons trop de catégories pour un graphique. Le graph est assez peu lisible
@qloridant bien d'accord avec toi sur le manque de lisibilité du graphie. Concernant les histogrammes, il est bon de manière générale de classer les labels par ordre décroissant. Ici, une alternative serait d'utiliser un pie chart, avec la même problématique d'ordonner les données (voir screen shot ci-dessous).
Concernant la métadonnée "rights_holder", comme indiqué plus haut, l'écriture de la propriété est erronée par rapport à la définition dans GeoDCAT-AP dct:rightsHolder
, je propose qu'on rajoute un #TODO dans le code et d'un log warning pour préciser que la fonction du DCAT reader devra être modifiée.
Par ailleurs, la définition exacte de dct:rightsHolder
associé à un dataset dans la documentation de GeoDCAT-AP précise :
This property refers to an Agent (organisation) holding rights on the Dataset.
On s'éloigne bien de la définition de dct:creator
:
This property refers to an Agent (organisation) holding rights on the Dataset.
Je propose de renommer le ticket "Détenteur des Droits"
Je viens de changer la visualisation par un camembert dans Metabase :
Je vois une incohérence entre la table et le camembert (on ne retrouve pas la DDT du Gers en top position) et le tableau inclut une ligne associé au nombre total de données :
En filtrant sur "ZNIEFF", le camembert réexpose également les valeurs nulles :
Je viens de renommer "détenteur des droits" par "propriétaire", dans le ticket et dans metabase.
Suppression de l'histogramme
Doc supprimée : `ℹ️ Astuce de lecture :
12% des jeux de données [[issus de l'univers pré-formaté 🖼️ {{Univers}}]] [[issus de la recherche 🔎 "{{moteur_de_recherche}}"]] [[issus du catalogue 📙 "{{catalogue}}"]] sont détenus par la DDT du Gers (le nombre effectif peut varier selon les filtres). En dessous de 2,5% de jeux de données détenus, un propriétaire est classé dans "Autre". `
User story
Je suis Un gestionnaire de catalogue. Un administrateur ministériel des données.
Je veux En tant que gestionnaire, j'ai un rôle de coordination. Je souhaite apprécier mon patrimoine de données au regard des besoins de standardisation et d'agrégation, d'ouverture ou plus simplement de sélection des jeux de données les plus pertinents pour mon usage. Je souhaite pouvoir évaluer la qualité de mon patrimoine et en promouvoir l'amélioration :
Je peux [Par exemple depuis l'univers PPRN #5 (base de travail de l'itération 2)]
[Distinguer mes jeux de données] Visualiser la distribution de mes jeux de données selon les producteurs.
Besoins associés (du plus au moins évident)
Implémentation
Superset chart type: Histogram
Métadonnées utilisées
creator
Remarques
Après première production de l'indicateur
Comment l'indicateur en l'état répond aux besoins ?
L’indicateur permet de comprendre la distribution des jeux de données par organisation propriétaire.
Filtré sur un périmètre, il permet de savoir vers qui diriger les actions d’amélioration des données et des métadonnées (en lien avec l’indicateur sur les points de contacts).
Il permet aussi de se rendre compte de la concentration ou non de la propriété des jeux de données, et comprendre ainsi quel propriétaire pourrait être ciblé en priorité.
Comment pourrait-il être amélioré (préconisations) ?
Il s’agit de bien documenter, dans l’outil, ce que recouvre la notion de propriétaire d’un jeu de données, par rapport à d’autres métadonnées (notamment points de contact “dataset” et points de contact “catalogue”). Pour connaître les pratiques de saisie, on peut se référer au guide de saisie des métadonnées INSPIRE.