slovak-egov / nkod-portal

Webový portál pre NKOD (Národný katalóg otvorených dát)
Other
1 stars 1 forks source link

Nesprávne URI poskytovateľov #97

Closed miroslavliska closed 3 months ago

miroslavliska commented 4 months ago

V súvislosti s dnešným problémom, kde sa pri ručnej zmene URI pri poskytovateľa Úrad pre dohľad nad zdravotnou starostlivosťou https://data.gov.sk/id/legal-subject/fccf022a-284c-4927-b4f1-b4ec84adb495 zmenilo ručne na https://data.gov.sk/id/legal-subject/30796482 načo sa stratili údaje (rozlišli sa identifikátory), som našiel viacero poskytovateľov, ktorí majú nesprávne URI, a neviem to už v harvestri opraviť.

Týmto dotazom cez SPARLQ Endpoint

PREFIX foaf: <http://xmlns.com/foaf/0.1/>
PREFIX dct: <http://purl.org/dc/terms/>
PREFIX dcat: <http://www.w3.org/ns/dcat#>
SELECT distinct ?publisher ?name
{
  ?dataset a dcat:Dataset .
  ?dataset dct:publisher ?publisher .
  ?publisher foaf:name ?name .

  FILTER (contains(strafter(str(?publisher), "https://data.gov.sk/id/legal-subject/"),"-"))
}

je získaný súbor s 12 poskytovateľmi s URI, kde je namiesto iča použitý hash. Do toho CSVčka som pridal aj správne IČO, aby sa to ľahšie opravilo. Tieto nesprávne identifikátory sa musia vymeniť za správne všade, kde sa používajú. NekorektneURIposkytovatela.csv

Ešte dopĺňam že by sa asi malo zakázať meniť URI pre editácii. Len pri vytváraní nového poskytovateľa sa to môže natypovať.

MarkySim commented 4 months ago

Nemáme tam nejaký bug pri pridávaní nového datasetu? Podľa informácií tam predtým tento problém nebol.

miroslavliska commented 4 months ago

Nemáme tam nejaký bug pri pridávaní nového datasetu? Podľa informácií tam predtým tento problém nebol.

Ja len pre zápis. Práve som vytvoril nového poskytovateľa NOCKu a vidím aj súbor, kde sa tie dáta uložili, a tam je URI poskytovateľa správne tak, ako som zadal.

<https://data.gov.sk/id/legal-subject/00164615> a foaf:Agent;
                                                foaf:homepage <https://www.nocka.sk/>;
                                                foaf:mbox "nocka@nocka.sk";
                                                foaf:name "Národné osvetové centrum"@sk;
                                                foaf:phone "";
                                                ls:legalForm <https://data.gov.sk/def/legal-form-type/331>.
lk8w commented 4 months ago

Keď pozerám na ten zoznam problémových OVM tak mi príde, ze či to nie sú tie čo v poslednom čase pridávali dataset/y. obrázok

hornik-informo commented 4 months ago

Tieto URI poskytovateľov prišli z data.gov.sk. S datasetmi to nesúvisí.

miroslavliska commented 4 months ago

Teraz keĎ som študoval tie tri zdrojové adresáre, tak v súbore 2958309aaaa64060b53eee476ec638ff.ttl vidím nesprávny názov - Levice (je to MIRRI).

image

a našiel som rovnakú chybu aj v súbore image

miroslavliska commented 4 months ago

Keď pozerám na ten zoznam problémových OVM tak mi príde, ze či to nie sú tie čo v poslednom čase pridávali dataset/y.

No, niečo na tomto môže byť. P. @hornik-informo , zda sa mi ze s týmto suvisi aj tento problem https://github.com/slovak-egov/nkod-portal/issues/103

hornik-informo commented 4 months ago

Takto to prišlo z harvestra, toto je priamo výstup SPARQL zo dňa importu (subject - predicate - object):

image

Vzniklo to zrejeme tu: https://github.com/datova-kancelaria/nkod-registrace/blob/main/poskytovatel%C3%A9/00307203.ttl

miroslavliska commented 4 months ago

Ano, pravda, ten isty pripad. Moja chyba, develop nebol mergnuty do produ. Prosim opravit v subore v NKODe.

hornik-informo commented 4 months ago

Pozmenili sme URI poskytovatľov podľa CSV.

miroslavliska commented 3 months ago

OKI, ďakujem za vyriešenie. Task zatváram.