dataoverheid / dcat-ap-donl

Het applicatie profiel van de Europese DCAT-AP standaard voor uitwisseling met data.overheid.nl.
https://dataoverheid.github.io/dcat-ap-donl/
2 stars 1 forks source link

Property: update/modification date in Distributie: Verplicht of Aanbevolen? #4

Closed keestrautwein closed 1 year ago

keestrautwein commented 2 years ago

Het "update/modification date" veld is belangrijk om de kwaliteit van de aangeboden distributie te kunnen inschatten: Een oude dataset heeft minder waarde dan een nieuwere. Ook kan deze eigenschap niet worden afgeleid. Dus het lijkt passend om op zijn minst deze property "aanbevolen" te maken. Maar zijn er bezwaren om de property verplicht te maken? Zou dat leiden tot uitvak van datasets? Uitval lijkt op te lossen met een beschrijving hoe het veld in te vullen als de distributie er geen waarde voor heeft.

CelineJansen commented 2 years ago

Aanbevolen lijkt me beter dan verplicht. Binnen ons portaal kan de verversing van data automatisch worden afgeleid, maar als je die optie niet hebt is het bijhouden van zo'n veld best een klus. Als zoiets verplicht wordt zijn bepaalde eisen ook belangrijk: kijken we zuiver naar updates binnen de data, of nemen we ook updates van metadata mee. En wat doen we met data die automatisch ingepland is om eens in de zoveel tijd te verversen? Dan draait er bijvoorbeeld elke week een script om de brondata binnen de halen en te verwerken. Op het eerste gezicht zou je dan zeggen dat elke week de "modification date" ook ververst kan worden. Maar wat als de brondata niet gewijzigd is? Dat is het lastig om te controleren. Je weet dus niet of er daadwerkelijk sprake is van wijzigingen, of dat er alleen sprake is van een poging tot verversing.

image

Overigens wel een nuance: historische data kan natuurlijk ook van waarde zijn. En een dataverzameling die in eerste instantie een recente "modification date" heeft en daarna 3 jaar niet wordt bijgehouden waar dat wel zou moeten / kunnen, is ook niet echt meer van waarde. Dus wat dat betreft zegt een opzichzelfstaande "modification date" nog niet alles om op te filteren. Een update frequentie van data in combinatie met een "modification date" zegt dan meer.

importalis commented 2 years ago

De definitie is gewijzigd in:

Deze eigenschap bevat de datum waarop de data-eigenaar de gegevens van de distributie voor het laatst heeft gewijzigd. Dat geldt zowel voor een wijziging van de inhoud van de distributie als in de metadata van de distributie.

Zie https://github.com/dataoverheid/dcat-ap-donl/wiki/Distribution#property-updatemodification-date

Ook is eigenschap dct:modified "Aanbevolen" gemaakt.

CasperKoop commented 1 year ago

Bij regelmatig updaten van de dataset kan dit veld leeg worden gelaten en frequentie worden gebruikt. Dit moet als invul-instructie bij het veld. Verder gaan we mee aanbevolen en passen we aan dat dit veld alleen gaat over de data zelf, niet over de metadata (zie W3C definitie)

CasperKoop commented 1 year ago

Ter extra verduidelijking: release date / update/modification date date gaat altijd over de data inhoudelijk. Als je changes op de metadata bij wilt houden kun je een catalog record aanmaken. Donl houdt dit niet bij.