Geonovum / dcat2-ap-nl

DCAT-AP-NL
0 stars 0 forks source link

Wat is een dataservice en wat is een distributie? #23

Open idevisser opened 1 year ago

idevisser commented 1 year ago

Huidige situatie:

Voor geo data, zien we dat alleen waar het verplicht is (door INSPIRE) en door de service provider PDOK service metadata conform ISO 19119 wordt aangemaakt. Het merendeel van de dataservices wordt in de praktijk alleen ontsloten via de dataset metadata, via de elementen van online transferoptions. Ook de dataservices met aparte metadata conform ISO 19119 worden ontsloten via de dataset metadata.

Voor INSPIRE is inmiddels het ontsluiten van de service metadata via de capabilities van de service zelf geaccepteerd. Voor INSPIRE is het zeer recent dus ook niet meer verplicht de services apart te beschrijven conform ISO 19119. De service moet wel worden ontsloten via de dataset metadata.

In het ontsluiten van services via de dataset metadata wordt er in het NL profiel op ISO 19115 onderscheid gemaakt tussen endpoint en accesspoint;

Een accessPoint URL levert informatie over de service inclusief zijn endPoints. Dat kan bijvoorbeeld een capabilities of WSDL document zijn.

Een endPoint URL levert rechtstreeks een dataset in een specifiek mediatype

Probleem: De definities voor distributie en dataservice zijn; dcat:Distribution represents an accessible form of a dataset such as a downloadable file. dcat:DataService represents a collection of operations accessible through an interface (API) that provide access to one or more datasets or data processing functions.

De manier van ontsluiten van dataservices via distributie in de dataset metadata komt overeen met de praktijk in de geo wereld maar de definitie van distributie in DCAT past niet helemaal. Vinden we dat onze services (WFS/WMS) ook een DCAT distribution zijn – of zijn ze dataservices? Als we naar de DCAT definities kijken, lijkt het om een dataservice te gaan.

De usageguide dataset-distribution-dataservice geeft verheldering: "Anything that has not the intend to provide a downloadable representation of a dataset is a data service. Data services offer smarter, more interactive ways to the data."

Daarnaast is de eigenschap dcat:accessURL van distributie verplicht in DCAT-AP, maar is niet altijd aanwezig, bijvoorbeeld als er alleen een rechtstreekse download link beschikbaar is. In dat geval is dcat:downloadURL wel aanwezig. Andersom geldt hetzelfde.

Voorstel: Voor services die data ontsluiten, kan met het onderscheid wat wordt gemaakt tussen accessPoint en endPoint in de dataset metadata in het NL profiel op ISO 19115, de distributie in DCAT toch eenduidig worden ingevuld;

dcat:accessURL A URL of the resource that gives access to a distribution of the dataset. E.g., landing page, feed, SPARQL endpoint. komt min of meer overeen met accessPoint ( die URL levert informatie over de service inclusief zijn endPoints. Dat kan bijvoorbeeld een capabilities document zijn, bv http://services.rce.geovoorziening.nl/rce/wms?&request=GetCapabilities&service=WMS)

dcat:downloadURL The URL of the downloadable file in a given format. E.g., CSV file or RDF file. The format is indicated by the distribution's dcterms:format and/or dcat:mediaType komt min of meer overeen met endPoint (die URL levert rechtstreeks een dataset in een specifiek mediatype, bv http://services.rce.geovoorziening.nl/rce/wfs?request=GetFeature&service=WFS&version=2.0.0&typeName=NationalListedMonuments&outputFormat=json&Count=50)

via de eigenschap dcat:accessService in de distributie kan eventueel de service metadata ontsloten worden.

Services die niet rechtstreeks een dataset in een specifiek mediatype opleveren, maar wel toegang geven tot een of meer datasets of processing functies, worden gezien als [dcat:DataService]

Verder een issue aanmaken bij DCAT-AP, met het voorstel dat één van [dcat:accessURL] of [dcat:downloadURL] verplicht is. [dcat:accessService] is niet altijd aanwezig in de metadata, maar wel verplicht in DCAT-AP.

hekl commented 1 year ago

Goed voorstel.

CasperKoop commented 1 year ago

Het issue over gebruik van dcat:accessURL en dcat:downloadURL is volgens mij vaker naar voren gekomen in de EU, maar het lukt mij nog niet om een definitieve aanbeveling voor gebruik te vinden. Het draait er allemaal een beetje omheen. Zo te zien is dit issue in 2017 behandeld in een DCAT-AP implementation guidelines Working Group meeting.

Als ik deze slides interpreteer lijkt het erop dat de aanbeveling is om dcat:accessURL altijd in te vullen. Voor een omschrijving tot toegang, maar ook voor een directe download. Wanneer de download direct beschikbaar is worden beiden ingevuld. Ik vermoed dat er ergens een definitievere aanbeveling is.

CorMelse commented 8 months ago

Even een punt van aandacht: we zien de ontwikkeling van de OGC Rest API's hard gaan. Een API is feitelijk een service, dus zou het m.i. een dcat:accessService kunnen zijn. maar ik zie dit ook wel als een dcat:accessURL terwijl een dcat:downloadURL ook likt te passen.

Wat vinden jullie, vooral omdat de voorbeelden nu een echte "ouderwetse" OGC WMS/WFS geven? ik zou net als @CasperKoop voor de accessURL gaan.