Gebruik van identifiers

gabswiersma commented 1 year ago

Vanuit DCAT-AP-EU zijn guidelines opgesteld voor het gebruik en beheer van verschillende identifiers - en voor uitleg: https://github.com/SEMICeu/DCAT-AP/issues/223, https://github.com/dataoverheid/dcat-ap-donl/issues/24. Vraag is of we hier momenteel iets mee kunnen of moeten vanuit dit profiel.

idevisser commented 1 year ago

Huidige situatie:

DCAT-AP kent twee optionele identifiers als property voor dataset; dct:identifier wat de belangrijkste identifier voor de dataset bevat en adms:identifier, wat naar een secundaire identifier verwijst.

DCAT-AP geeft uitvoerders de keuze om in dct:identifier

de waarde te geven die de catalogus toekent of
de waarde die de eerste uitgever/eigenaar van de dataset (beschrijving) heeft gegeven.

Daarnaast kan dct:identifier een URI of andere unieke identifier zijn.

Probleem: De verschillende mogelijkheden om dct:identifier te vullen, leid tot het ontstaan van inconsistenties bij harvesting, dezelfde datasets worden niet als zodanig herkend.

Voorstel Het voorstel is om de identifier die door de data eigenaar gegeven wordt aan een dataset te behouden in dct:identifier. Deze identifier wordt gebruikt voor de unieke identificatie van de dataset. De eventuele andere identifiers worden in adms:identifier opgenomen, zoals identifiers die door een catalog worden toegekend. Eventueel kan dan naast de waarde van de identifier zelf ook aan toegevoegd wie deze toevoeging gedaan heeft. Bijvoorbeeld in dct:creator. Hierdoor ontstaat een lijst met equivalente identifiers.

Daarvoor wordt dct:identifier een verplichte property met de beperking (ten opzichte van DACT-AP) dat deze property de waarde bevat die de eerste uitgever/eigenaar heeft gegeven.

Daarvoor wordt adms:identifier een verplichte property. Het gebruik van adms:identifier wordt uitgebreid, niet alleen voor secundaire identifiers, maar voor alle identifiers die aan de dataset zijn toegewezen tijdens het verwerken en delen van die dataset in het catalogusnetwerk.

Om ervoor te zorgen dat de meta-informatie over de identifier niet alleen de identifier-waarde is, bevat het voorstel ook aanvullende vereisten voor adms:Identifier.

CasperKoop commented 1 year ago

In principe eens met het voorstel. Alleen vraag ik mij af of het nodig is om de kardinalieteit van de adms:Identifier 1..n te maken. De guideline zegt het volgende:

0..n (*3) (*3) The minimum cardinality will be defacto 1 since managing a dataset without any identifier in a catalogue would be a rarity.

Wanneer we verplichten dat adms:identifier gebruikt wordt, betekend dit dat de creator/publisher dct:identifier en adms:identifier invult?

CorMelse commented 1 year ago

eens met voorstel

Geonovum / dcat2-ap-nl

Gebruik van identifiers #7