digst / DCAT-AP-DK

DCAT-AP-DK er en dansk anvendelsesprofil til beskrivelse af datasæt og datakataloger
https://digst.github.io/DCAT-AP-DK/releases/v.2.0/docs/
8 stars 1 forks source link

Bemærkninger fra OPEN DATA DK #17

Closed aidig closed 3 years ago

aidig commented 4 years ago

Afsender: Open Data DK (v. Københavns Kommune)

I Open Data DK repræsenterer vi både en dataportal (www.opendata.dkhttp://www.opendata.dk) og vores medlemskommuner som dataudgivere.

Vores dataudgivere er således offentlige institutioner af meget varierende størrelse og beredskab.

Vores databrugere er både offentlige institutioner og private brugere, mange med en mere explorativ tilgang til brugen af vores data.

Vi har ikke mange erfaringer med DCAT standarden, men er i fuld gang med at implementere denne på vores egen portal til både publicering og høstning fra andre åbne dataportaler.

Som dataportal ser vi en klar fordel i en standard der er bredt accepteret og anvendt og DCAT er velegnet til dette. Vi er også begejstrede for alle tiltag der kan lette formidling og reference af data på tværs af institutioner og portaler.

Vores erfaringer med vores medlemskommuner er at deres beredskab og interne processer i forhold til metadata svinger meget. Fra store enheder med automatiserede dataproduktionsprocesser, til mindre enheder med primært ”håndholdt” datadistribution. Dette har bevirket at vi i vores egen metadata-anbefaling har gået efter en minimumsmodel. Jeg har vedlagt vores metadata-model til orientering. (red: https://portal.opendata.dk/dataset/c9007248-7131-436f-b3e5-b0554f3d82a1/resource/f807163f-3014-4c31-aa0b-0dbc165da7cb/download/opdatering-af-datasaet_september-2019.pdf)

Vores erfaring er at det er meget vanskeligt at vedligeholde bare nogenlunde kvalitet i metadata på tværs af et heterogent systemlandskab. Endvidere er det vores erfaring at ”dækningsgraden” af metadata, falder kraftigt med hver ny oplysning der skal anføres, og at dette gælder særligt ”obligatoriske” oplysninger.

Det er endvidere vores erfaring at kvaliteten af de faktisk anførte oplysninger falder kraftigt med kompleksiteten i modellen. Dette gælder særligt for oplysninger som forskellige roller og processer, og ting som emneord i lukkede terminologier. Vedligehold af metadata er typisk ikke en prioriteret opgave, og vil ofte bortfalde hvis den ikke er meget enkel. Endvidere tager oplysningerne næsten altid udgangspunkt dataudgiverens subjektive ”hverdag”, hvor ting som for eksempel roller og emnetermer kan opfattes meget forskelligt.

Jeg håber I kan bruge vores erfaringer til noget.

Eksempler på DCAT feed:

Catalog: https://admin.opendata.dk/catalog.jsonld?page=2

Datasæt: https://admin.opendata.dk/dataset/taellinger-kryds.jsonld

DCAT feeds er tilgængelige i 4 formater (xml, ttl, n3, jsonld) via extension https://admin.opendata.dk/dataset/taellinger-kryds.xml

Vi bruger CKAN DCAT extension: https://github.com/ckan/ckanext-dcat

aidig commented 3 years ago

Ovenstående erfaringer har været godt input til arbejdet og vi har etableret en minimumsmodel med obligatoriske elementer og en lidt større som indeholder lidt mere. Se https://github.com/digst/DCAT-AP-DK/tree/master/releases/v.2.0/views. Derudover har vi tilføjet Open Data DKs eksempler på DCAT feed her: https://github.com/digst/DCAT-AP-DK/tree/master/releases/v.2.0/examples