datova-kancelaria / nkod-pipeline

Obsahuje export LP-ETL pipeline NKOD pro deployment do k8s
0 stars 1 forks source link

Je potrebné uchovať pôvodné čitateľné URL datasetu pre data.gov.sk datasety #2

Closed miroslavliska closed 5 months ago

miroslavliska commented 6 months ago

Jedná sa o uvedené DPU image

miroslavliska commented 6 months ago

Prikladám testovacie riešenie.

PREFIX nkod: <https://data.gov.sk/slovník/nkod/>

DELETE {
  ?old ?p ?o .
  ?s2 ?p2 ?old .
}
INSERT {
  ?dataset ?p ?o .
  ?s2 ?p2 ?dataset .
}
WHERE {
  ?old nkod:type "dataset" ;
       nkod:name ?name ;
       ?p ?o .

  ?s2 ?p2 ?old .

  BIND(IRI(CONCAT("https://data.gov.sk/dataset/", ?name)) AS ?dataset)
}
miroslavliska commented 6 months ago

Po hlbšej analýze som sa rozhodol nemeniť už princíp tvorby URI datasetu, tj. používať čitateľné URI, a vraciam sa k pôvodnému konceptu tvorby URI pre NKOD a to používaním hashovacieho kódu.

V skutočnosti toto platí aj pre starý data.gov.sk, kde sa primárne používa hashové URI, napr. https://data.gov.sk/dataset/462089ba-33e7-4b9d-b2b6-e47b962f3460

je to isté ako toto: https://data.gov.sk/dataset/register-odborne-sposobilych-osob-ruvz-zh-voda-vodovody

Datasety v novom NKODe sa teda nezmenia! Avšak musím vyriešiť zachovanie starého čitateľného URI z data.gov.sk a aj umožniť pre nové datasety mať čitateľné URI. Toto by ideálne mohla prevziať vlastnosť dcat:landingPage pre dataset (čo je správne podľa DCAT3).

Zatiaľ tento ticket nezatváram, ale premenujem ho na "Uchovanie pôvodného čitateľného URL datasetu"

miroslavliska commented 5 months ago

Je to hotové. Na uchovanie sa používa vlasntosť datasetu dcat:landingPage image