Geonovum / dcat2-ap-nl

DCAT-AP-NL
0 stars 0 forks source link

Waardelijst: Thema's #10

Open skornsekj opened 1 year ago

skornsekj commented 1 year ago

Doel van issue is om inzicht te krijgen in het gebruik van waardelijsten over de verschillende domeinen heen, en op basis daarvan te komen tot waardelijsten voor DCAT-AP NL

Per eigenschap willen we inventariseren welke waardelijsten er nu in de verschillende domeinen (bijv. de ISO 19115 metadata in geo-domein) worden gebruikt. Komen deze waarden overeen uit de (verplichtte) waardelijsten in DCAT-AP? Zijn de er aanpassingen nodig?


Waardelijst: dcat:mediaType; Dataset; Dataset Theme Vocabulary

20230517: Input van werkgroep

Organisatie Waardelijst
Kadaster (stelselcatalogus) DSO waardelijst thema
Logius OWMS
DONL Overheid: Taxonomie beleidsagenda (TBA)
RIVM OWMS: Taxonomie beleidsagenda

Issue: TBA is verouderd. Aangedragen oplossing. Gebruik de Thema-indeling voor Officiële Publicaties (TOP-Lijst). Mapping TBA naar TOP is beschikbaar

Wens: DONL. Gebuik maken van TOP-lijst (TOOI) ipv TBA

Graag jullie aanvullingen.

hekl commented 1 year ago

CBS: er is een eigen themalijst op de website, maar de CBS taxonomie bevat vergelijkbare thema's.
Thema's kunnen in een zoeksysteem als globale filter opties dienen: selecteer uit de resultaten alleen die datasets die iets met "Landbouw" te maken hebben. Dat is handig voor een gebruiker.

aframosp commented 10 months ago

Binnen het volksgezondsheids domein van het RIVM gebruiken we de CBS taxomonie/Hierachy, als deze opgenomen kan worden is dan goed.

keestrautwein commented 10 months ago

Binnen DCAT-AP-DONL werkgroep hebben we be-/afgesproken dat we de Clusterbegrippen van Stelselcatalogus kunnen gebruiken om de inhoud van een dataset aan te geven. De Clusterbegerippen kunnen gebruikt worden om in termen die de meeste mensen begrijpen aan te geven wat voor soort gegevens een bepaalde dataset bevat. Denk aan "Natuurlijk Persoon", "Organisatie", "Inkomen", .... Dit soort inhoudelijke "labeling"-lijsten zijn weinig beschikbaar. Clusterbegrippen zullen altijd vrij algemeen zijn, omdat ze bedoeld zijn binnen het totale (Nederlandse) overheidsdomein gebruikt te worden. Daardoor zijn ze heel geschikt voor gebruikers die een bepaald domein nog niet zo goed kennen, en dus niet kunnen zoeken op de gebruikelijke termen uit dat domein. Omdat we streven naar het ontsluiten van alle overheidsgegevens voor alle gebruikers (die daar recht op hebben) is dit een nuttige eigenschap.

Deze lijst wordt actief door Stelselcatalogus onderhouden en beheerd. Hoewel die lijst op dit moment kort is met een focus op het Geo-domein, staat op de Logius backlog een story om de lijst uit te breiden, o.a. aan de hand van bovenstaande CBS taxonomie en andere bronnen. Wij verwachten de uitbreiding in het vierde PI (~kwartaal) op te pakken. Overigens staat Logius open voor alle suggesties mbt het uitbreiden van de lijst.

keestrautwein commented 10 months ago

Een ander punt dat in de DCAT-AP-DONL ter sprake is gekomen dat er een beperkt aantal globale themalijsten zijn die op (bijna) alle datasets toepasbaar zijn, maar dat veel thema-lijsten zeer nuttig zijn in een bepaalde domein, maar niet daarbuiten.

Voorbeelden van zulke lokale thema-taxonomiën zijn eenvoudig te bedenken: de meeste thema-lijsten gericht op het justitieel domein zullen waarschijnlijk niet ingevuld kunnen worden voor datasets uit een medisch domein en v.v.

Dit soort thema-lijsten kunnen dus in technische zin alleen maar optioneel zijn, maar binnen een bepaald domein zouden we willen dat die wel worden ingevuld. Het lijkt me goed dat het DCAT-AP-NL profiel "locale" themalijsten aan raadt die voor datasets uit bepaalde domeinen gezien moeten worden als verplicht. Zo'n lijst van taxonomieën en domeinen zal zich waarschijnlijk uitbreiden, aangezien in deze werkgroep bij lange na niet alle domeinen vertegenwoordigd zijn.

keestrautwein commented 10 months ago

Verder is een thema-lijst een skos:concept wat betekent dat de complexiteit ervan uiteen kan lopen van een eenvoudig woordenlijst tot een taxonomie of een complexe thesaurus. Het kiezen van een waarde uit een waardelijst is (wel afhankelijk van de lengte) relatief eenvoudig, maar het kiezen van de juiste waarde uit een thesaurus kan complex zijn, zowel voor de opsteller als de gebruiker van een DCAT beschrijving. Willen we in ons profiel een poging doen iets op op te nemen om tot een gestandaardiseerde aanpak te komen? Of zien we dat als een UX/UI probleem van applicatie die DCAT beschrijvingen opstellen of aanbieden?

skornsekj commented 8 months ago

Voorstel:

CorMelse commented 8 months ago

Ik sluit me bij @aframosp aan, de cbs lijst sluit beter aan op het nl gebied. is er een mapping te maken met de EU Dataset Theme Vocabulary, dan zou dat mooi zijn richting EU uitwisseling