ecolabdata / ecospheres

Portail des données de la transition écologique et de la cohésion des territoires
https://ecologie.data.gouv.fr
2 stars 0 forks source link

[MD] Zones géographiques nommées (géozone) #30

Open streino opened 11 months ago

streino commented 11 months ago

Besoin

Dans le contexte des bouquets, pouvoir :

Dans un contexte plus général (moins prioritaire) :

Plus adapté que https://github.com/ecolabdata/ecospheres/issues/31 :

Background

https://github.com/abulte/ecospheres-datagouvfr-metadata/blob/main/ecospheres-datagouvfr-metadata.md#geozones

https://github.com/ecolabdata/ckanext-ecospheres/blob/main/ckanext/ecospheres/vocabulary/parser/parsers.py Travail de synonymie mené par Ecosphères: territory mappé sur thesaurus INSEE.

Détails

Standards

DCAT

<dct:spatial>
  <dct:Location rdf:about="https://sws.geonames.org/3337388/"/>
</dct:spatial>

ISO

<gmd:geographicElement>
  <gmd:EX_GeographicDescription>
    <gmd:geographicIdentifier>
      <gmd:MD_Identifier>
        <gmd:code>
          <gco:CharacterString>http://id.insee.fr/geo/departement/75</gco:CharacterString>
        </gmd:code>
...

Geo-IDE expose les URI INSEE via <gmd:geographicIdentifier>.

INSPIRE

Pas de MD. Préconise uniquement Bbox.

Thesaurus intéressants

Attendu

Prérequis : https://github.com/ecolabdata/ecospheres/issues/47

Mapper URL INSEE dans dct:Location vers les nouvelles geozones lors du moissonnage.

Exposition DCAT (moins prioritaire, slt si besoin pour POC qualité).

Hors scope : Multiples vocabulaires avec synonymes -> https://github.com/ecolabdata/ecospheres/issues/39

Thesauruv commented 11 months ago

"Précision bbox insuffisante pour modéliser un territoire précis" : comme discuté, affirmation à nuancer suivant la logique d'identification du territoire. Si le territoire associé à un dataset correspond au territoire administratif couvert par l'organisation productrice de la donnée, dans le cas d'une DDT, cette information est moins précise qu'une BBOX couvrant une superficie infra-départementale (observée en volume non négligeable dans le POC Ecosphères CKAN, a minima 30% des cas).

Détail du calcul de la distribution dans le notebook 03_bbox.ipynb, figure disponible sous format slide .html dans le même dépôt. image