datova-kancelaria / nkod-pipeline

Obsahuje export LP-ETL pipeline NKOD pro deployment do k8s
0 stars 1 forks source link

Niektoré naharvestované datasety LKODu MFSR sú JSON nevalidné #38

Open miroslavliska opened 4 months ago

miroslavliska commented 4 months ago

1) Napr. ked si natiahnem data priamo dataset na disk - SAVE LINK AS

tak dostanem nevalidne JSON, co preukazuje, ze sa nevygeneruje spravne, resp. s nejakym zakazanym znakom.

image

A potom sa tento dataset nedostane do harvestovania.

2) Podobný prípad je tento dataset:

image

miroslavliska commented 4 months ago

Od Jakuba mám info

ahoj, v rychlosti - ono to neni json-ld, ale json-ld v html. Tedy kdyz to zkopirujes z browseru, zkopirujes jen ten json-ld. Ale kdyz to stahnes jako soubor (staci dat ulozit a otevrit v textovem editoru) tak je to spatne Click or press enter to display {:filename} in the image preview

Áno, je to pravda. Keď si rovno stiahnem súbor z tohto linku spôosom SaveAs https://opendata.mfsr.sk/opendata/catalog/celkove-prijmy-a-vydavky-na-hotovostnej-baze

tak skutočne to nie je validný JSONLD, ani JSON. image

A oprava sa musí stať na strane MFSR.