ecolabdata / ecospheres-metadata

Visualisation des métadonnées moissonnées dans Ecosphères
3 stars 1 forks source link

Histogramme Couverture géographique #9

Closed johanricher closed 9 months ago

johanricher commented 10 months ago

User story

Je suis Un gestionnaire de catalogue. Un administrateur ministériel des données.

Je veux En tant que gestionnaire, j'ai un rôle de coordination. Je souhaite apprécier mon patrimoine de données au regard des besoins de standardisation et d'agrégation, d'ouverture ou plus simplement de sélection des jeux de données les plus pertinents pour mon usage. Je souhaite pouvoir évaluer la qualité de mon patrimoine et en promouvoir l'amélioration :

Je peux [Par exemple depuis l'univers PPRN #5 (base de travail de l'itération 2)]

[Distinguer mes jeux de données] Identifier la part de jeux de données locaux et nationaux. Visualiser la distribution spatiale de mes jeux de données.

Besoins associés (du plus au moins évident)

Implémentation

Superset chart type: Histogram

Métadonnées utilisées

Remarques

Après première production de l'indicateur

Comment l'indicateur en l'état répond aux besoins ?

L'indicateur permet de comprendre la répartition des jeux de données qui sont disponibles à l'échelle départementale. Aussi, il permet d'analyser la répartition des jeux de données entre l'échelle communale et départementale.

Filtré, l'indicateur permet de comparer la distribution de la couverture géographique. Par exemple, il pourrait comparer sur quel département les jeux de données PPRN sont les plus nombreux et constater des différences dans la production de ces données entre les départements.

Comment pourrait-il être amélioré (préconisations) ?

Les retours lors des entretiens utilisateurs sur cet indicateur ont permis de noter des pistes d'amélioration :

  1. Ajouter a minima la couverture géographique 'nationale'
  2. Ajouter les couvertures géographiques : 'régionale', 'EPCI' et 'SCOT'
  3. Ajouter les jeux de données dont la couverture géographique ne correspond pas à une délimitation administrative

De manière plus complexe, cet indicateur pourrait être utilisé pour analyser la répartition géographique des différents champs d’un même jeu de données. Il faudrait néanmoins que l’outil ouvrir le jeu de données, ce qui n’est pas le cas actuellement.

johanricher commented 10 months ago

@qloridant A vérifier au préalable pour préciser l'implémentation :

Thesauruv commented 10 months ago

@johanricher voir également mon commentaire dans le ticket #10

Pour l'identification de la couverture géographique, passer par les URI de l'Insee (par ex http://id.insee.fr/geo/departement/48) de la proriété dcterms:spatial est une solution rapide, mais cette information est moins présente les bounded boxes que j'avais utilisées pour le graphe en copie ci-dessous (avec la règle utilisée pour les catégories). De manière générale, pour l'interprétation de chacun des graphes, il est important que l'on sache le niveau de couverture des métadonnées associées.

departments_range = range(
    departments["area_km2"].min().astype(int), 
    max(departments["area_km2"].max(), regions["area_km2"].min()).astype(int))

regions_range = range(
    max(departments["area_km2"].max(), regions["area_km2"].min()).astype(int), 
    regions["area_km2"].max().astype(int))

supra_regional = range(
    regions["area_km2"].max().astype(int),
    regions["area_km2"].sum().astype(int))

metropolitan_data["category"] = metropolitan_data["area_km2"].apply(lambda x:
    "01_Intra-départemental" if (int(x) < departments["area_km2"].min().astype(int)) 
    else "02_Départemental" if (int(x) in departments_range)
    else "03_Régional" if (int(x) in regions_range)
    else "04_Suprarégional" if (int(x) in supra_regional)
    else "05_Supranational" if (int(x) > regions["area_km2"].sum().astype(int)) 
    else None)

image

Thesauruv commented 10 months ago

Potentiellement, une cellule avec le nombre de datasets associés sous une carte communale/départementale/etc.

qloridant commented 9 months ago

Basé sur le champ spatial, j'ai recensé deux cas différent, afin de reproduire au maximum la distribution proposée par @Thesauruv

clementmandron commented 9 months ago

@qloridant on est d'accord que la barre de l'histogramme "Intra-départemental" correspond uniquement aux communes (ou aussi à d'autres strates administratives infre-départementale?). En d'autres termes, pourrait-on renommer le label "Nombre de jdd dont la couverture géo est une commune" ?