datova-kancelaria / nkod-pipeline

Obsahuje export LP-ETL pipeline NKOD pro deployment do k8s
0 stars 1 forks source link

Duplicitný poskytovateľ MIRRI #30

Closed hornik-informo closed 3 months ago

hornik-informo commented 4 months ago

Poskytovateľ MIRRI http://data.gov.sk/id/legal-subject/50349287 sa vyskytuje v nahavestovaných dátach 2x, zrejme raz z data.gov.sk a raz z githubu pre LKOD - túto registráciu navrhujem odstrániť, aby sme zmigrovali len čisté dáta.

miroslavliska commented 4 months ago

Poskytovateľ MIRRI http://data.gov.sk/id/legal-subject/50349287 sa vyskytuje v nahavestovaných dátach 2x, zrejme raz z data.gov.sk a raz z githubu pre LKOD - túto registráciu navrhujem odstrániť, aby sme zmigrovali len čisté dáta.

MIRRI, ale aj MFSR sa harvestuju z data.gov.sk aj z lkodov, to by nemal byt problem nie? Resp. v RDF databaze to v poriadku. Môžem tento task zavrieť alebo mám niečo spraviť? Tých poskytovateľov na githube https://github.com/datova-kancelaria/nkod-registrace/tree/develop/poskytovatel%C3%A9 by som nechcel mazať, musel by som upravovať query v procesingu.

miroslavliska commented 4 months ago

Aha, teraz som si všimol, že v zozname poskytovateľov je to 2x p.@hornik-informo to je ale asi chyba na strane GUI, nie? Ved oba MIRRI maju rovnake URI (rovnaku identiftu)

image

hornik-informo commented 4 months ago

Už v SPARQL je MIRRI dvojmo. Skúsime to odfiltrovať v piatok pri importe.

image