datagov-cz / nkod

Národní katalog otevřených dat (NKOD) a sběr požadavků na něj. Tento repozitář byl udržován v rámci projektu OPZ č. CZ.03.4.74/0.0/0.0/15_025/0013983 a nyní je udržován v rámci Národního plánu obnovy.
https://data.gov.cz
6 stars 2 forks source link

Různé odpovědi na stejný dotaz #27

Closed petrbouchal closed 3 years ago

petrbouchal commented 3 years ago

Zaznamenal jsem dva dny po sobě podivnou situaci, kdy SPARQL endpoint vrací v odpovědi na jednoduchý dotaz "všechny sady od ČSÚ" (níže) v rozpětí minut různé počty řádek - napřed 15, pak 5, pak 4, pak 1 a po čase zase všech 723. Přihodilo se to včera i dnes (s jinými počty vrácených řádků).

Pochopitelně nedokážu popsat, jak to zreplikovat, ale raději reportuji. Doslova jsem jen pouštěl ten stejný dotaz dokola v rozhraní na data.gov.cz/sparql; přes HTTP request z mé aplikace se to chovalo stejně (tj. stejné dotazy dvěma jinými cestami ve stejný čas generovaly stejné chybné odpovědi).

Pokud něco dělám špatně, budu rád za upozornění. Zkoušel jsem i jiné kódy poskytovatelů a tam se to zdálo v pořádku, ale netestoval jsem to tak důkladně.

Dotaz:

PREFIX dcterms: <http://purl.org/dc/terms/>
PREFIX ovmr: <https://rpp-opendata.egon.gov.cz/odrpp/zdroj/orgán-veřejné-moci/>

 SELECT ?dataset_iri
 WHERE {
   GRAPH ?g {
     ?dataset_iri dcterms:publisher ovmr:00025593
   }
} LIMIT 1000
jakubklimek commented 3 years ago

To se může stát, pokud to zkoušíte v době updatu endpointu. Ten aktuálně trvá celkem cca 40 minut a probíhá denně kolem 20:30. Jednotlivé datové sady jsou nejprve vymazány, a pak je nahrán nový obsah, což trvá. Šlo by to dělat i jinak (např. tvořit jinou databázi a pak přepnout), ale zatím to nebylo třeba.

petrbouchal commented 3 years ago

Děkuji za vysvětlení, tak to jsem se jen trefil s časováním.