Geonovum / dcat2-ap-nl

DCAT-AP-NL
0 stars 0 forks source link

Gebruik van identifiers #7

Open gabswiersma opened 1 year ago

gabswiersma commented 1 year ago

Vanuit DCAT-AP-EU zijn guidelines opgesteld voor het gebruik en beheer van verschillende identifiers - en voor uitleg: https://github.com/SEMICeu/DCAT-AP/issues/223, https://github.com/dataoverheid/dcat-ap-donl/issues/24. Vraag is of we hier momenteel iets mee kunnen of moeten vanuit dit profiel.

idevisser commented 1 year ago

Huidige situatie:

DCAT-AP kent twee optionele identifiers als property voor dataset; dct:identifier wat de belangrijkste identifier voor de dataset bevat en adms:identifier, wat naar een secundaire identifier verwijst.

DCAT-AP geeft uitvoerders de keuze om in dct:identifier

Daarnaast kan dct:identifier een URI of andere unieke identifier zijn.

Probleem: De verschillende mogelijkheden om dct:identifier te vullen, leid tot het ontstaan van inconsistenties bij harvesting, dezelfde datasets worden niet als zodanig herkend.

Voorstel Het voorstel is om de identifier die door de data eigenaar gegeven wordt aan een dataset te behouden in dct:identifier. Deze identifier wordt gebruikt voor de unieke identificatie van de dataset. De eventuele andere identifiers worden in adms:identifier opgenomen, zoals identifiers die door een catalog worden toegekend. Eventueel kan dan naast de waarde van de identifier zelf ook aan toegevoegd wie deze toevoeging gedaan heeft. Bijvoorbeeld in dct:creator. Hierdoor ontstaat een lijst met equivalente identifiers.

Daarvoor wordt dct:identifier een verplichte property met de beperking (ten opzichte van DACT-AP) dat deze property de waarde bevat die de eerste uitgever/eigenaar heeft gegeven.

Property | URI | Range | Cardinality | definition | Usage Note -- | -- | -- | -- | -- | -- main identifier | dct:identifier | Literal | 1 | The main identifier for the Dataset | The value is assigned by the main responsible of the Dataset, i.e. the owner or publisher.

Daarvoor wordt adms:identifier een verplichte property. Het gebruik van adms:identifier wordt uitgebreid, niet alleen voor secundaire identifiers, maar voor alle identifiers die aan de dataset zijn toegewezen tijdens het verwerken en delen van die dataset in het catalogusnetwerk.

Property | URI | Range | Cardinality | definition | Usage Note -- | -- | -- | -- | -- | -- identifier | adms:identifier | adms:Identifier | 1..n (*3) | described identifier for the Dataset | This property refers to each identifier that a catalogue or a process (i.e. harvesting) assigns.

Om ervoor te zorgen dat de meta-informatie over de identifier niet alleen de identifier-waarde is, bevat het voorstel ook aanvullende vereisten voor adms:Identifier.

Property | URI | Range | Cardinality | definition | Usage Note -- | -- | -- | -- | -- | -- notation | skos:notation | Literal | 1..1 | content string which is the identifier |   schema manager name | adms:schemaAgency | Literal | 1..1 | the name of the agency that manages the identifier scheme | (*2) schema manager agent | dct:creator | foaf:Agent | 1..1 | the agency that manages the identifier scheme | (*2)
CasperKoop commented 1 year ago

In principe eens met het voorstel. Alleen vraag ik mij af of het nodig is om de kardinalieteit van de adms:Identifier 1..n te maken. De guideline zegt het volgende:

0..n (*3) (*3) The minimum cardinality will be defacto 1 since managing a dataset without any identifier in a catalogue would be a rarity.

Wanneer we verplichten dat adms:identifier gebruikt wordt, betekend dit dat de creator/publisher dct:identifier en adms:identifier invult?

CorMelse commented 8 months ago

eens met voorstel