dataoverheid / dcat-ap-donl

Het applicatie profiel van de Europese DCAT-AP standaard voor uitwisseling met data.overheid.nl.
https://dataoverheid.github.io/dcat-ap-donl/
2 stars 1 forks source link

Voorstel voor een AgentRole taxonomie #31

Open WterBerg opened 2 years ago

WterBerg commented 2 years ago

Voorstel maken voor hoe de AgentRole taxonomie vorm zou kunnen krijgen.

keestrautwein commented 2 years ago

ISO code lijst met rollen: https://standards.iso.org/iso/19115/resources/Codelists/gml/CI_RoleCode.xml De rollen onderkent rond Basisregistraties: https://www.digitaleoverheid.nl/overzicht-van-alle-onderwerpen/stelsel-van-basisregistraties/rollen-stelsel-basisregistraties/

keestrautwein commented 2 years ago

Ik heb e.e.a. uitgezocht. Deel van ISO-19115-1 is de CI_RoleCode waardelijst, die een aantal rollen definieert die uitgevoerd kunnen worden om informatie te ontsluiten. ISO-19115-1 is een standaard waarmee onder andere het vastleggen van geografische gegevens in metadata wordt vastgelegd. Om die reden maakt ook Geonovem van deze standaard gebruik.

DCAT v2.0 legt twee standaard properties vast van resource te weten creator en publisher, beide gedefinieerd in de Dublin Core. Andere rollen kunnen worden vastgelegd met behulp van deze ISO-19115-1 RoleCode waardelijst. Merk op dat in de ISO lijst verschillende rollen worden gedefinieerd die door DCAT doorgaans als dct:creator en dct:publisher worden gedefinieerd, maar fijnmaziger vastlegging is hiermee mogelijk.

Binnen het Stelsel van Basisregistraties worden een aantal rollen benoemd:

Deze zijn te "mappen" op de rollen die ISO onderkent, maar zijn grofmaziger.

Een voorlopige tabel met alle waarde van ISO Role Code en hun mapping uit verschillende bronnen

Mapping van DataCite is te vinden op https://www.ngdc.noaa.gov/wiki/index.php/ISO_19115_and_19115-2_CodeList_Dictionaries#CI_RoleCode.

Value Documentation Vertaling van Geostandaarden Vertaling Geodata IRI DCAT Registratiesrollen dataCite Bioportal Commentaar
resourceProvider party that supplies the resource Partij die de data verstrekt ? dct:publisher, Verstrekker dataCite:Creator "De partij verantwoordelijke voor de resources waarmee de gegevens worden aangeboden.
Let op: Is in SvB zelfde als distributor"
custodian party that accepts accountability and responsibility for the resource and ensures appropriate care and maintenance of the resource Partij verantwoordelijk voor het beheer van de data. Beheerder, conservator, bewaarder Toezichthouder
owner party that owns the resource Partij die eigenaar is van de data. Bronhouder?
user party who uses the resource Partij die de data gebruikt. gebruiker? Afnemer Partij die de gegevens consumeert
distributor party who distributes the resource Partij die de data verstrekt. dct:publisher, , Uitgever/Verstrekker Verstrekker dataCite:Publisher "De partij die de gegevens verspreid, gebruik makend van de resources van de resourceProvider.
Let op: Is in SvB zelfde als resourceProvider"
originator party who created the resources Partij die de data heeft gecreëerd resource creator, dct:creator dataCite:Creator
pointOfContact party who can be contacted for acquiring knowledge about or acquisition of the resource Partij die optreedt als contactpunt voor uitwisselen van kennis of verstrekking van de data. dcat:contactPoint data collector, contactable expert In DCAT Vcard vab organization
principalInvestigator key party responsible for gathering information and conducting research Partij die betrokken was bij de uitvoering van onderzoek resource creator, dct:creator dataCite: Creator
processor party who has processed the data in a manner such that the resource has been modified Partij die de data heeft bewerkt, zodanig dat de data is gewijzigd. Dit lijkt een tussenpartij te zijn
publisher party who published the resource Partij die de data publiceert. Verstrekker http://def.isotc211.org/iso19115/-1/2014/CitationAndResponsiblePartyInformation/code/CI_RoleCode/publisher De partij die de gegevens publiceert
author party who authored the resource Partij die auteur is van de data. resource creator, dct:creator Bronhouder dataCite: Creator
sponsor party who speaks for the resource - Hoeft geen financieel sposor te zijn: kan iemand zijn die verantwoordelijk is of zich aan de resource verbonden heeft
coAuthor party who jointly authors the resourc - resource creator, dct:creator Bronhouder dataCite: Creator
collaborator party who assists with the generation of the resource other than the principal investigator - resource creator, dct:creator Bronhouder dataCite: Creator
editor party who reviewed or modified the resource to improve the content - resource creator, dct:creator Bronhouder
mediator a class of entity that mediates access to the resource and for whom the resource is intended or useful - Deze rol snap ik niet goed. Is dit een tussenpartij die de gegevens zelf ook consummeert?
rightsHolder party owning or managing rights over the resource - Verstrekker? "In SvB is dat de Verstrekker. Daarbuiten kan iemand anders de rechten hebben.
In DCAT wordt dit eventueel in Access Rights opgeslagen. In DONL slaan we deze rol niet standaard op."
contributor party contributing to the resource - resource creator, dct:creator Bronhouder
funder party providing monetary support for the resource - Opdrachtgever
stakeholder party who has an interest in the resource or the use of the resource -
keestrautwein commented 2 years ago

Verder valt er nog veel te zeggen over IRI's van de ISO lijst.

Belangrijk voor gebruik binnen Linked Data is het bestaan van een IRI voor iedere waarde uit een waardelijst, en bovendien een IRI voor de waardelijst zelf. Helaas maakt ISO geen Linked Data IRI's aan

Uitgangspunten bij opstellen DCAT profiel

Ons DCAT profiel willen we zo goed mogelijk verankeren in Linked Data landschap zodat de toekomstvastheid en betrouwbaarheid ervan zo hoog mogelijk is. Dat betekent dat we zo veel mogelijk gebruik willen maken van standaarden. Deze uitgangspunten vertalen zich m.b.t. waardelijsten naar drie mogelijk oplossingen:

  1. We zoeken een bestaande waardelijst van een voldoende bestrouwbare partij en gebruiken de URI's daarvan
  2. Als een bestaande waardelijst te veel of niet genoeg waardes heeft, definieren we een eigen waardelijst waarvan alle URI's verwijzen naar één of meer bestaande waardelijsten, waarvan we niet per sé alle waardes gebruiken. Hiermee zijn de waardes in ieder geval gestandaardideerd, hoewel de waardelijst dat niet is.
  3. De minst aantrekkelijke oplossing is om in het profiel een waardelijst eigen waardes te definieren, hoewel het voor de hand ligt dat data.overheid.nl deze waardelijst vervolgens voor heel Nederland gaat gebruiken en er dus een redelijk groot gebruik ontstaat.

Bestaande oplossingen

Als startpunt vinden we een DCAT voorbeeld waarin de IRI van een waarde uit een andere ISO-19115-1 wordt gebruikt. Deze IRI is gedefinieerd door Australia’s National Science Agency, maardaar lijkt noch de waarde, noch de waardelijst nog te bestaan te bestaan, wat de statius ervan als standaard ernstig ondermijnd.

Op zoek naar alternatieven vinden we op Bioportal oa. een URI voor Publisher als een skos:Concept: http://def.isotc211.org/iso19115/-1/2014/CitationAndResponsiblePartyInformation/code/CI_RoleCode/publisher Deze URI verwijst naar ISO zelf, maar resolved daar niet.

Het leidt ons wel naar een deel van de ISO site met daarop downloadable ZIP's met daarin een definitie van onze codelijst door ISO zelf. Helaas is de waardleijst gedefineerd als een XML-schema. Hoewel de waardes niet direct bruikbaar zijn binnen een Linked Data waardelijst, geeft ons dat wel een unieke XML namespace: http://standards.iso.org/iso/19115/-3/cit/1.0. De suggestie lijst te zijn dat een waarde uit de codelijst geïndentifeerd kan worden door de namespace te koppelen aan de term. Bijvoorbeeld voor "funder": http://standards.iso.org/iso/19115/-3/cit/1.0#funder of http://standards.iso.org/iso/19115/-3/cit/1.0/funder

Gebruikmakend van het feit dat ISO-19115 een GEO standaard is gaan we op geostandaarden zoeken en vinden we de CI-RoleCode lijst in Nederlands metadata profiel op ISO 19115 voor geografie versie 2.1.0 van 30 juni 2020. Vreemd genoeg bestaan er twee "base"-URI's ofwel namespace:

  1. http://www.isotc211.org/2005/gmd
  2. http://www.opengis.net/gml

Ook binnen de EU is een waardelijst die ruimer is dan de lijst van ISO: https://op.europa.eu/en/web/eu-vocabularies/concept-scheme/-/resource?uri=http://publications.europa.eu/resource/authority/role

Samenvatting URI's

We vinden een aantal name-spaces waarmee de waardelijst en zijn waardes van IRI's voorzien kan worden:

Optie 0: De ISO pagina met de RoleCode is zelf een XML pagina met de codelijst in XML, maar niet als Linked Data URI's: https://standards.iso.org/iso/19115/resources/Codelists/gml/CI_RoleCode.xml

  1. http://www.isotc211.org/2005/gmd
  2. http://www.opengis.net/gml
  3. http://def.isotc211.org/iso19115/-1/2014/CitationAndResponsiblePartyInformation/code/CI_RoleCode/publisher
  4. http://standards.iso.org/iso/19115/-3/cit/1.0 (alleen voor de waardelijst?)
  5. https://op.europa.eu/en/web/eu-vocabularies/concept-scheme/-/resource?uri=http://publications.europa.eu/resource/authority/role
  6. https://inspire.ec.europa.eu/metadata-codelist/ResponsiblePartyRole/

Op welke basis gaan we IRI's toekennen? Dit moeten we nog bespreken.

keestrautwein commented 2 years ago

Optie 0 en optie 6 lijken de beste kandidaten.

Optie 0: https://standards.iso.org/iso/19115/resources/Codelists/gml/CI_RoleCode.xml bevat geen Linked Data URI's maar een URI kan geconstrueerd worden die vervolgens resolved naar de overzicht pagina van de waardelijst, bijvoorbeeld https://standards.iso.org/iso/19115/resources/Codelists/gml/CI_RoleCode.xml#funder

Optie 6: https://inspire.ec.europa.eu/metadata-codelist/ResponsiblePartyRole/ is een waardelijst met URI's beheerd door de EU project INSPIRE. Maar: De waarde "funder" ontbreekt waardoor de rol "Opdrachtgever" niet in deze waardelijst weergegeven kan worden.

Optie 5: Deze waardelijst lijkt bedoeld voor gebruik binnen de EU organisatie. Sluit niet goed aan op de ISO lijst.

Optie 4 en optie 2: Dit zijn XML definities die geen URI's voor de waardes in de waardelijst definiëren en dus niet resolveer

Optie 3 is een URI van ISO zelf, maar lijkt niet (meer) ondersteund te worden en resolved niet.

Optie 1 is een hele oude standaard, die vervangen is door nieuwere.

keestrautwein commented 2 years ago

We hebben besloten om optie 0 te gebruiken als URI's. We maken een waardelijst waarin deze URI's zijn opgenomen. Deze waarden worden door ISO dan resolved in een overzichtspagina met een beschrijving van de hele waardelijst. Dat is acceptabel omdat het de menselijke gebruiker voldoende informatie geeft. Voor machines is deze oplossing sub-optimaal.

keestrautwein commented 2 years ago

Suggestie: Leg voor de relevante waardes een skos:equalMatch van de ISO lijst naar de INSPIRE lijst van de EU: https://inspire.ec.europa.eu/metadata-codelist/ResponsiblePartyRole/

WterBerg commented 2 years ago

Voorstel is uitgewerkt in https://github.com/dataoverheid/dcat-ap-donl/blob/main/taxonomy/roles.ttl