diggsweden / DCAT-AP-SE

Projekt för DCAT-AP-SE.
https://docs.dataportal.se/dcat/
Creative Commons Attribution 4.0 International
14 stars 3 forks source link

Byt till licenser från publication office #100

Open matthiaspalmer opened 2 months ago

matthiaspalmer commented 2 months ago

Contact Details

No response

What benefits does the suggestion solve?

För att öka interoperabiliteten i EU bör vi använda samma URI:er för välkända licenser.

Feature suggestion description

Vi byter ut den lista med creative commons licenser mot de som definierats av publication office: https://op.europa.eu/en/web/eu-vocabularies/dataset/-/resource?uri=http://publications.europa.eu/resource/dataset/licence

Alternative solutions

No response

Additional information

No response

matthiaspalmer commented 2 months ago

Om vi byter ska vi ha med alla 161 som listas, eller bara de 7 vi har i DCAT-AP-SE2? Dvs 6 CC4.0 och CC0.

carwash commented 2 months ago

Jag är som sagt på mötet spontant emot detta. Det finns redan URI:er för dessa rättighetsmärkningar – att använda EU-specifika sådana istället för dess skapar förvirring och sänker intenoperabilitet, snarare än att främja det. Även om det finns skos:exactMatch-relationer. Jag dock hört av mig till Europeana och frågat om detta, och återkommer här med deras svar.

bjornhagstrom commented 2 months ago

Jag är inne på samma linje som @carwash. Det känns tokigt att hålla sig i den lilla simbassängen EU när det finns en större internationell pool.

carwash commented 2 months ago

Europeana har återkommit med ett – enligt min åsikt – mycket bra svar, som jag ska försöka sammanfatta här.

De har förstås aldrig jobbat med DCAT-AP SE, och inte heller med senaste DCAT-AP 3.0. Däremot har de jobbat med DCAT-AP 2.1 för att leverera datat till data.europa.eu. Detta arbete finns dokumenterat på https://docs.google.com/document/d/17vPxcfnu9VUVUXk9fgv0ZxJ9p5um8qqqN8Xt0dTNbUw/ . De påpekar dock, att även där, de har använt de riktiga URI:erna för t.ex. CC-licenserna, inte URI:erna som Publications Office förespråkar. Det värsta de fick göra i deras mappning var, att explicit deklararera CC0-URI:n som både "licens" och "rättighetsmärkning" av typ "public domain":

<http://creativecommons.org/publicdomain/zero/1.0/>
    a dct:LicenseDocument , dct:RightsStatement;
    dct:type <http://purl.org/adms/licencetype/PublicDomain> .

De håller med, om att det vore dumt att försöka öka kompatibilitet i ett ekosystem (Europa) på bekostnaden att man därmed bryter kompatibilitet med alla andra. De betraktar Publications Office-vokabulären snarare som en kontrollerad lista på tillåtna licenser/rättighetsmärkningar, inte att man ska tillämpa just deras URI:er.

De hänvisar även till DCAT-AP dokumentationen på https://semiceu.github.io/DCAT-AP/releases/3.0.0/#legal-information och citerar följande:

An assessment of data.europa.eu [DEU] in 2023 showed that there are different representations to indicate the same licence. To create a more harmonised experience throughout Europe, it is recommended to use the NAL licence maintained by the Publications Office if allowed by national legislation. If local representations are used, then the equivalence with a licence in this NAL should be provided. This mapping is expressed as metadata to local representation. Note that this mapping is not determining the reuse conditions; the legal binding reuse conditions are those that are directly associated with the Distribution or Data Service. Nevertheless, by applying this recommendation, it is possible for a cross-border reuser to get an insight in the reuse conditions without a detailed understanding the local legislation.

…vilket de tolkar som, att man inte är tvungen att använda Publications Office-URI:erna; snarare, att de ska tillämpas i sådana fall där det finns lokala varianter i praxis kring vilka URI:er man använder – då ska man enas kring NAL-URI:erna. Men att i det vanligare fallet att det finns etablerade välkända URI:er – som det finns för CC-licenserna, PD-mark, och RightsStatements.org – då kan man med fördel använda dem.

Jag skulle föreslå, att vi absolut förhåller oss till de rättighetsmärkningarna som finns med i Publications Office-vokabulären, men att vi fortsätter använda deras "riktiga" URI:er, och bara vänder oss till de av vokabuläreren tilldelade URI:erna när ingen annan URI finns för rättighetsmärkningen.

matthiaspalmer commented 2 months ago

En liten undersökning visar att förutom CC licenser så är två datamängder som använder: https://opendatacommons.org/licenses/dbcl/1.0

I övrigt är det 15 st. specifika licenser från trafiklabb med två datamänder vardera.

Så slutsatsen att behovet för att kunna välja andra licenser från publication office lista minimal.

matthiaspalmer commented 2 months ago

Att ange rättighetsmärkningar för CC licenser är onödigt. De är välkända och varje aktör bör inte ge sig på att kategorisera CC-BY för sig, det kommer bara ge upphov till en uppsjö av felaktiga kategoriseringar.

Enbart om man väljer att ange en egen licens, som t.ex. trafiklab gjort, bör man kategorisera explicit.

matthiaspalmer commented 1 month ago

Förslaget är att avslå denna ändring men att förklara att om man av någon anledning vill använda NAL så är man fri att göra det. På dataportal.se kommer vi skriva om så att NAL licenser och CC licenser som sammanfaller behandlas utan att det blir duplikat i sökningen.