Informasjonsforvaltning / dcat-ap-no

Apache License 2.0
9 stars 3 forks source link

Burde dcat:Dataset også bruke dct:license? #411

Closed OyvindLGjesdal closed 3 years ago

OyvindLGjesdal commented 3 years ago

Hei,

Vi jobber med denne og tenkte å legge inn lisens for et datasett. Ser at denne ikke finnes, burde den det? Fra https://data.norge.no/specification/dcat-ap-no

Mvh Øyvind

oystein-asnes commented 3 years ago

Det er med overlegg ikke mulig å legge inn lisens for et datasett i DCAT-AP-NO v2. Bruksvilkårene (lisensen) er i stedet knyttet til selve leveransen av datasettet - altså dcat:distribusjon eller dcat:dataService. ( I tillegg kan en angi lisens for selve datakatalogen, men det blir noe annet).

Et datasett kan ha mange distribusjoner, og hver distribusjon kan ha ulike lisenser. Å angi lisens for selve datasettet i tillegg kan føre til inkonsistens, og egenskapen kan uansett ikke arves fra datasett til distribusjon/datatjeneste ettersom flere distribusjoner (med ulik lisens) kan oppgis for et datasett.

En av innvendingene mot å flytte lisens 'oppover' fra distribusjontil datasett er altså at det ikke er noen formell måte distribusjonene kan arve denne opplysningen på. Hvis egenskapene flyttes til datasett (med den implisitte betydningen at samme bruksvilkår gjelder for alle distribusjoner og datatjenester), må et program (og et menneske) som mottar DCAT-metadata se to steder: se først i beskrivelsen av distribusjonen, hvis ingenting der, se i beskrivelsen av datasettet. Å knytte lisensinformasjonen til datasettet kan gjøre det lettere å registrere et datasett, men gjør altså altså datakatalogen mer komplisert å bruke for både mennesker og maskiner.

DCAT-AP-NO følger her samme praksis som EU applikasjonsprofil (DCAT-AP og BReg-AP). Dette er gjort på tross av av W3C har inkludert lisens for datasett-klassen i sin versjon 2 og i forslaget til versjon 3.

PS: Datasett:tilgangsnivå er beslektet med lisens, men disse må ikke forveksles. Tilgangsnivå er angivelse av det juridiske grunnlaget for tilgang, og dette skjer på datasett-nivå. Dette kan oppgis uavhengig av om det eksister faktiske leveranser av data i form av en distribusjon eller datatjeneste. I DCAT skal ulike distribusjoner for et datasett skal være leveranser av samme informasjon (men i ulike formater og former). Dersom en lager ulike utsnitt av samme datasett for å tilpasse disse til ulike tilgangsnivå skal dette registreres som ulike datasett og ikke ulike distribusjoner av det samme datasettet.

OyvindLGjesdal commented 3 years ago

Takk, det gir mening. Da er tanken at et datasettet alltid enten tilbys gjennom en tjeneste, eller via en nedlastbar distribusjon?

Vi begynte med å ta utgangspunkt i kun obligatoriske klasser og egenskaper for å komme igang, og distribusjon hadde vi enda ikke oppfattet. Vi kan se på https://github.com/Informasjonsforvaltning/dcat-ap-no/blob/develop/shacl/DCAT-AP-NO-shacl_shapes_2.00.ttl for andre restriksjoner/forventninger vi ikkje umiddelbart har fanget opp

oystein-asnes commented 3 years ago

Det er korrekt oppfattet, bortsett fra at det kan også kan være begge deler samtidig. Distribusjonen kan peke videre til datatjenesten ved hjelp av dcat:accessService og/eller datatjenesten kan peke på datasettet ved hjelp av dcat:servesDataset.

OyvindLGjesdal commented 3 years ago

Takk for gode og raske svar :)