diggsweden / DCAT-AP-SE

Projekt för DCAT-AP-SE.
https://docs.dataportal.se/dcat/
Creative Commons Attribution 4.0 International
14 stars 3 forks source link

Vilka properties ska / får anges på en datamängdsserie? #103

Open matthiaspalmer opened 2 months ago

matthiaspalmer commented 2 months ago

What benefits does the suggestion solve?

Metadata på en datamängdsserie gör det enkelt att få översikt över datamängdsserien

Feature suggestion description

Utöver de som anges i kapitel 7.8 i DCAT-AP 3.0 (applicable legislation , contact point , description , frequency , geographical coverage , modification date , publisher , release date , temporal coverage , title) vore det lämpligt också med dcat:theme samt dcatap:hvdCategory, se ärende https://github.com/SEMICeu/DCAT-AP/issues/362.

matthiaspalmer commented 2 months ago

Det verkar lämpligt att också inkludera:

  1. dcat:keyword - som komplement till kategorierna
  2. dcterms:conformsTo - när specifikationer sammankopplas med datamängder vill man inte ha en relation till varje datamängd i en datamängdsserie, då blir det viktigt att ha relationen till datamängdsserien.
  3. dcat:landingPage - att ha en landningssida känns mer relevant för en datamängdsserie än för datamängderna i serien. Att bara kunna ange den för datamängderna inne i datamängdsserien gör den mindre synlig och skulle inte motsvara helheten.
  4. dcterms:related - relationer bör kunna finnas på helheten såväl som på delarna
  5. dcat:qualifiedRelation - samma argument som för dcterms:related
  6. foaf:page - dokumentation behövs på serien också

Notera att enligt DCAT kapitel 12.2 kan metadata på Datamängdsserien delas in i två grupper:

  1. metadata som gäller för datamängdsserien
  2. metadata som gäller som talar om de dimensioner som serien reflekterar (tid, rymd, kategorier etc.)

Om man ska vara noga bör metadata tolkningen 1 ovan delas in i två undergrupper: 1a. metadata som gäller för datamängdsserien som serie betraktad 1b. metadata som gäller för den data som datamängdsserien representerar

Tolkning 1a. stödjs av inledande meningen i kapitel 12 som säger:

With "dataset series" we refer to data, somehow interrelated, that are published separately.

Tolkning 1b. stödjs av skrivningen i kapitel 12.2 om att dcterms:accrualPeriodicity ska tolkas som uppdateringsfrekvensen av nya datamängder som en del av serien

Sammantaget tyder skrivningarna i kapitel 12 på att en datamängdsserie måste tolkas på ett bredare sätt och att det är endast för en del av egenskaperna som DCAT explicit angett vilken tolkning som är den rätta. Dvs. det är fritt för producent och konsument att göra den tolkning som bäst passar.

Förslaget ovan är att vi lägger till dessa egenskaper, men lämnar det fritt att använda dem för de olika tolkningarna 1a, 1b, och 2.

Vi exemplifierar med foaf:page, dvs dokumentation. Dokumention som används på en datamängdsserie tillåts alltså handla brett om dataserien själv (1a), om datan som man når via datamängder i dataserien (1b) eller hur dataseriens dimensioner är organiserade (2). Hur lätt det är att se en distinktion mellan 1a, 1b och 2 beror på vilken egenskap man talar om, för foaf:page blir 1a och 2 svåra att separera.

bjornhagstrom commented 2 months ago

Jag har lite svårt att greppa skillnaderna här men om allt tillåts kanske det inte spelar så stor roll. Men ett eller flera exempel skulle kanske göra frågan tydligare om du vill ha mer feedback?

matthiaspalmer commented 1 month ago

@bjornhagstrom Inser att det blev för teoretiskt.

Jag föreslår att de som känner sig manade går igenom skrivningarna för varje property under datamängdsserie. Om någon av dem inte känns klar bör de förtydligas.

matthiaspalmer commented 1 month ago

Fält som motsvarar union beskrivs så på datamängdsserien. Alla som bör vara lika har annoterats med en ny rekommendation 21.