dataoverheid / dcat-ap-donl

Het applicatie profiel van de Europese DCAT-AP standaard voor uitwisseling met data.overheid.nl.
https://dataoverheid.github.io/dcat-ap-donl/
2 stars 1 forks source link

Verschillende talen #11

Closed importalis closed 1 year ago

importalis commented 2 years ago

De W3C maakt het mogelijk om de metadata zoals titel en beschrijving vast te leggen in verschillende talen. Op data.overheid.nl is nu maximaal een taal mogelijk.

Daarnaast is het mogelijk om de taal aan te geven van de dataset zelf.

De EU biedt ook de mogelijkheid om daarnaast ook apart de taal van de distributie aan te geven.

Wat is hier precies gewenst?

importalis commented 2 years ago

W3C specificeert dct:language als eigenschap in de superklasse Cataloged Resource. DCAT-AP-EU specificeert deze eigenschap voor Dataset, Catalog, Distribution en Catalog Record, maar weer niet in Data service. De definities verschillen ook:

DCAT-AP-EU

This property refers to a language of the Dataset.

W3C

A language of the item. This refers to the natural language used for textual metadata (i.e. titles, descriptions, etc) of a cataloged resource (i.e. dataset or service) or the textual values of a dataset distribution.

Vreemd genoeg staat bij de Usage note: If representations of a dataset are available for each language separately, define an instance of dcat:Distribution for each language and describe the specific language of each distribution using dct:language (i.e. the dataset will have multiple dct:language values and each distribution will have just one as the value of its dct:language property).

W3C lijkt ervan uit te gaan dat de taal van de metadata gelijk is aan de taal van de gegevens in de dataset.

Is dit een juiste aanname?

CasperKoop commented 2 years ago

Feedback van Huub: Je kan de taal ook aangeven met een taal tag bijv @en

WterBerg commented 1 year ago

Voorstel:

Metadata is altijd in maximaal een taal geschreven. Het ondersteunen van meerdere talen per object maakt het geheel onnodig complex. Bij data.overheid.nl is in de afgelopen zeven jaar nog nooit de wens uitgesproken om dit mogelijk te maken, er lijkt dus ook (in Nederland) geen behoefte te zijn om dit wel te kunnen.

Hoe dit qua implementatie eruit ziet is buiten de scope van de standaard zelf, maar ik kan me voorstellen dat je dat op een van onderstaande manieren doet:


Daarnaast zou ik voorstellen dat de metadata taal van een dcat:Distribution altijd overeen moet komen met de metadata taal van de bovenliggende dcat:Dataset.

CasperKoop commented 1 year ago

Ter aanvulling aan het gebruik van de languagetag. DCAT-AP 2.1 Hoofdstuk 8 geeft een uitgebreide beschrijving over het gebruik van language tags. Voor donl wordt dit erg uitgebreid. In overeenstemming met de EU worden de volgende talen ondersteund:

Taal Tag
Duits de
Engels en
Fries fy
Nederlands nl

Deze waardes komen overeen met ISO 639-1 en de IANA lijst van language tags