Open miroslavliska opened 3 months ago
TOP Priorita pre WPNKOD-SLA
Momentálne je to implementované takto (nie sú zobrazené podmienky použitia, ktoré sa do screenshotu nedostali):
Oprava serializácie sprístupnenia datasetu cez dátovú službu, súvisí s novým štandardom DCAT-AP-SK-3.0.0, ktorý bude už táto oprava čiastočne zahŕňať. https://github.com/slovak-egov/centralny-model-udajov/issues/16 . Tu je spracovaný návrh, ako začať serializovať distribúciu, ktorá je dostupná cez dátovú službu.
<https://data.gov.sk/set/44aa74a1-d0be-4f69-b764-bda2fb2bf601/resource/a3f65662-7e3a-4385-8f18-6dd5cc0f7a6e> a dcat:Distribution ;
leg:termsOfUse [ a leg:TermsOfUse ;
leg:authorsWorkType <http://publications.europa.eu/resource/authority/licence/CC_BY_4_0> ;
leg:databaseProtectedBySpecialRightsType <http://publications.europa.eu/resource/authority/licence/CC_BY_4_0> ;
leg:originalDatabaseType <http://publications.europa.eu/resource/authority/licence/CC_BY_4_0> ;
leg:personalDataContainmentType <https://data.gov.sk/def/personal-data-occurence-type/2> ] ;
dcat:accessURL <https://opendata.itms2014.sk/ciselnik-123.csv> ;
dcat:downloadURL <https://opendata.itms2014.sk/ciselnik-123.csv> ;
dct:format filetype:JSON ;
dcat:mediaType application:json ;
dct:conformsTo <https://opendata.itms2014.sk/scheme/hodnotaCiselnika.json> ;
dcatap:applicableLegislation <http://data.europa.eu/eli/reg_impl/2023/138/oj> ;
dct:title "list hodnota číselníka"@sk .
Z Distribúcie je odstránené dcat:downloadURL, dcat:conforms a dct:title. Tieto vlastnosti sú serializované do dátovej služby.
<https://data.gov.sk/set/44aa74a1-d0be-4f69-b764-bda2fb2bf601/resource/a3f65662-7e3a-4385-8f18-6dd5cc0f7a6e> a dcat:Distribution ;
leg:termsOfUse [ a leg:TermsOfUse ;
leg:authorsWorkType <http://publications.europa.eu/resource/authority/licence/CC_BY_4_0> ;
leg:databaseProtectedBySpecialRightsType <http://publications.europa.eu/resource/authority/licence/CC_BY_4_0> ;
leg:originalDatabaseType <http://publications.europa.eu/resource/authority/licence/CC_BY_4_0> ;
leg:personalDataContainmentType <https://data.gov.sk/def/personal-data-occurence-type/2> ] ;
dcat:accessURL <https://opendata.itms2014.sk/api/vratCiselnik?id=123&format=csv> ;
dct:format filetype:JSON ;
dcat:mediaType application:json ;
dcatap:applicableLegislation <http://data.europa.eu/eli/reg_impl/2023/138/oj> ;
dcat:accessService <https://data.gov.sk/set/44aa74a1-d0be-4f69-b764-bda2fb2bf601/resource/a3f65662-7e3a-4385-8f18-6dd5cc0f7a6e/service/a3f65662-7e3a-4385-8f18-6dd5cc0f7a6e> .
<https://data.gov.sk/set/44aa74a1-d0be-4f69-b764-bda2fb2bf601/service/a3f65662-7e3a-4385-8f18-6dd5cc0f7a6e> a dcat:DataService ;
dct:title "Hodnota číselníka"@sk ;
dcat:endpointURL <https://opendata.itms2014.sk/api/vratCiselnik?id=123&format=csv> ;
dcat:endpointDescription <https://opendata.itms2014.sk/swagger/#/ciselnik/hodnotaCiselnika#list> ;
dcatap:applicableLegislation <http://data.europa.eu/eli/reg_impl/2023/138/oj> ;
foaf:page <https://www.data.cz/služba/dokumentace> ;
dct:conformsTo <https://opendata.itms2014.sk/scheme/hodnotaCiselnika.json> .
Čiže keď to zhrniem: 1) je potrebné pridať novú možnosť (radio button), Súbor je prístupný cez dátovú službu 2) ak bude súbor dostupný cez dátovú službu, tak sa serializuje ako je to uvedené vyššie, tj. distribúcia už nebude mať dcat:downloadUrl ale len dcat:accessUrl, distribúcia dostane novú vlastnosť - legislatívny predpis (môže byť ich 0..N)(dcatap:applicableLegislation), ktorej hodnota je URI 3) dátová služba dostane údaje ako je vyššie uvedené. Tj. bude mať názov, URL endpointu, popis endpointu, legislatívny predpis, dokumentáciu (foaf:page) a dct:conforms.
Prosím ešte upresniť:
- Z distribúcie sa odstraňuje (a presúva do DataService) format a mediaType, platí to aj pre compressFormat a packageFormat?
Po hlbšej analýze, pokiaľ používateľ vyberie možnosť, že distribúcia je prístupná cez dátovú službu dcat:DataService, nedôjde k prenosu týchto údajov - tj. format a mediaType na Dátovú službu, ale ostatnú stále zavesené na distribúciu. Tak je to aj v príkladch DCAT-AP-HVD. Pravdepodobne som sa mierne pomýlil, kvoli jednému obrázku, kde boli tieto atribúty navyše uvedené v modeli ako optional, avšak nikde v príkladoch to tak nie je. Rovnako Česká republika implementovala DCAT-AP-3.0 aj HVD presne týmto spôsobom. Avšak stále platí, že vlasnosť distribúcie dcat:downloadUrl sa v tomto prípade schová. Povinná vlastnosť bude dcat:accessUrl.
Podobne ako to majú v DCAT-AP-CZ, pre distribúciu datasetu, ktorý sa bude sťahovať bez dátovej služby platí, že dcat:downloadUrl = dcat:accessUrl, a v prípade, že bude distribúcia dostupná cez Dátovú službu, tak dcat:accessUrl distribúcie, bude totožné ako dcat:endpointUrl Dátovej služby.
- Ako je zadefinovaný prefix dcatap?
Je to: http://data.europa.eu/r5r/
- Ako sa má validovať dcatap:applicableLegislation, môže to byť ľubovolné URI? Nemôže. Musí mať minimálne v sebe reťazec eli
Viac informácií je tu: https://wiki.vicepremier.gov.sk/pages/viewpage.action?pageId=101834353
Aby sa dali referencovať zákony, musia byť na to správne ELI uričká. Takto aspoň zamedzíme, aby tam pridávali poskytovatelia čokoľvek. Dôležitá ale informácia je, že všetky relácie dcatap:applicableLegislation sú v kardinalite 0... Pri datasete typu HVD je to [1..]
- Ako sú zadefinované nové vlastnosti, ktoré nie sú v DCAT-AP-SK 2.01 napr. ich povinnosť?
Toto bude kompletne zhrnuté v novom štandardne DCAT-AP-SK-3.0.0 https://htmlpreview.github.io/?https://github.com/slovak-egov/centralny-model-udajov/blob/develop/tbox/national/dcat-ap-sk/index.html
Okrem týchto uvedených vecí, ktoré treba opraviť v súvislosti s Dátovou službou, ešte vytvorím jeden task, ktorý došpecifikuje ostatné doplnenia metadát do katalogizácie, aby sme boli zhodný s DCAT-AP-SK-3.0.0
- Dôležitá vec je zadefinovať, ako budú tieto informácie prezentované verejne, napr. na detaile datasetu.
Pri správe datasetov poskytovateľom sa rozšíri ten radio button, ako je distribúcia prístupná, ak to bude službou, tak sa vyplnia údaje podľa definície uvedennej vyššie v tomto vlákne. Pre návštevníka sa zmení len to, že po rozkliknutí detailov distribúcie objavia aj údaje súvisiace s dátovou službou. Navrhujem ale zmeniť prvky tak, aby zobrazované URI neboli také krátke a na viacerých riadkoch.
Na teste sme sprístupnili správu dátových služieb, príklad zobrazenej služby je tu: https://wpnkod.informo.sk/datasety/60f48960-dabe-43a9-a4f9-6d65bebd90ea
Nemáme dobre spravený frontend na katalogizáciu distribúcie, ktorá je sprístupnená cez API. Návrh na implementáciu bude už zladený so štandardom DCAT-AP-SK-3.0.0 https://github.com/slovak-egov/centralny-model-udajov/issues/16