datagov-cz / nkod

Národní katalog otevřených dat (NKOD) a sběr požadavků na něj. Tento repozitář byl udržován v rámci projektu OPZ č. CZ.03.4.74/0.0/0.0/15_025/0013983 a nyní je udržován v rámci Národního plánu obnovy.
https://data.gov.cz
6 stars 2 forks source link

Při sklízení CKANu odhadnout MIME z pole format, pokud je pole mime null #5

Closed mordae closed 3 years ago

mordae commented 6 years ago

V kódu CKANu lze nalézt mapování pole format na MIME type^1. V případě, že má pole mimetype u zdroje hodnotu null, mohlo by se při sklizni vyvodit z pole format dle tohoto mapování.

jakubklimek commented 6 years ago

Obecně problém s CKAN je, že příliš nepodporuje Internetové standardy. Uvedené mapování mapuje CKAN formáty na řadu neexistujících (application/x-*) a nebo léta zastaralých (application/x-n3) MIME typů. To znamená, že je pro automatické zpracování nepoužitelné.

To vede na to, že by bylo třeba extra pro CKAN mapovat formáty ručně na základě výskytů v harvestovaných datech, což je nesystémové řešení. Nejčastěji používaných MIME-Typů ale není příliš a lze je uživatelům CKAN nabízet k vyplnění jako číselník. Vzhledem k nutnosti upravovat CKAN pro NKOD tak jako tak je systémovější řešení vyplňovat tuto položku správně. Že to jde je vidět třeba na CKANu https://linked.opendata.cz.

mordae commented 6 years ago

A máme někde patche, které by navedly CKAN správně vyplnit pole mime?

jakubklimek commented 6 years ago

Nemáme. Do zmíněné instance je to zapsáno pomocí API, nikoliv skrz CKAN formulář.

jakubklimek commented 3 years ago

V nové verzi OFN Rozhraní katalogů otevřených dat již rozhraní CKAN API není podporováno kvůli rostoucímu nesouladu s webovým standardem DCAT. Podpora pro harvestaci skrze CKAN API v NKOD tedy již nebude rozvíjena.