mff-uk / odcs-dpus

Repository for DPUs (Data processing units) for ETL tool for RDF data
3 stars 2 forks source link

[RUIAN] Spatny LAU region pro obce #62

Closed martinnec closed 10 years ago

martinnec commented 10 years ago

Pro instance ruian:Obec je asi neco spatne v hodnotach property ruian:lau

Priklad:

http://ruian.linked.opendata.cz/resource/obce/595144

... je to obec "Vysocany" v okrese Znojmo

ma prirazeny dva LAU kody:

http://linked.opendata.cz/resource/region/595144 http://linked.opendata.cz/resource/region/CZ0647

Prvni je spravne (595144 je kod Vysocan).

Druhy je blbe (CZ0647 je kod /asi/ okresu Znojmo)

jakubklimek commented 10 years ago

LAU maj 2 levely a to jsou oni.

martinnec commented 10 years ago

To je blbost, ta properta ruian:lau znamena bud, ze Vysocany "maji LAU kod" (595144) nebo "jsou soucasti LAU kodu" (CZ0647). Oboji to ale bejt nemuze, to je spor.

Ja to chapu jako to prvni (tj. "resource ma LAU kod"). Takze ted kdyz dam dotaz na LAU kod Vysocan, tak dostanu, ze Vysocany jsou 595144 (=Vysocany) a taky ze jsou CZ0647 (= Znojmo). To druhy je evidentne blbost, Vysocany != Znojmo

jakubklimek commented 10 years ago

Stejne tak to muze znamenat ze Vysocanum jsou prirazeny 2 lau kody, jeden level 2 kde jsou jen ony a jeden level 1 kde je jich vic. Pak je treba se ptat na lau kod prislusnyho levelu, kdyz chces jen ten jeden.

Da se to ale samozrejme rozdelit napr. na ruian:lau1 ruian:lau2 a to samy pro nutsy. To je ale otazka, zda to, jakyho levelu ten NUTS/LAU je, rozlisovat tim jakou propertou je pripojenej, nebo jako je to ted tema datama u LAU ktery to rikaj. Oboji jsou LAU kody prirazeny objektu...

To ze objekt ma 2 lau kody neznamena ze Vysocany = Znojmo, prave diky tem levelum.

martinnec commented 10 years ago

No nevim, vubec nechapu, proc to tak je. Je to podle me proste semanticky spatne a povede to ke zmatkum:

http://ruian.linked.opendata.cz/resource/obce/595144

... ma dva LAU kody (595144 a CZ0647)

... a pak ma nadrazeny okres (ruian:okres), ktery ma LAU kod CZ0647

1) Neni jasny, co tedy znamena property ruian:lau ... je to nejaka nic nerikajici matouci property. Ja bych ocekaval, ze konzistentne se vsemi ostatnimi property ma jasnou semantiku : ruian:lau JE LAU kod toho regionu. 2) Dva regiony, kde jeden je casti druheho, maji nejak prirazeny stejny LAU kod a neni jasny, ktery je ten spravny (musim mit background knowledge, kterou pises v commentu vyse).

Existuje nejaky duvod, proc maji mit Vysocany ty dva LAU kody? Proc potrebuju vedet LAU kod CZ0647 u Vysocan, kdyz je to LAU kod nadrazenyho okresu? Ten potrebuju vedet, kdyz chci proste vedet LAU kod okresu Vysocan a ten zjistim tak, ze se na ten okres podivam (pres ruian:okres) a tam zjistim okres.

jakubklimek commented 10 years ago

Hm... no to je fakt. Duvod je ten ze stejne je to ve zdrojovych datech. OK, pri pristim update RUIAN (mozna i dneska, pokud to Tomasovi funguje) to vyhodim.

martinnec commented 10 years ago

Ono to je ve zdrojovych datech? Ach jo :-). No, stejne bych to spravil. I kdyby to pro ne nejaky smysl melo, tak je to redudnantni, takze my to v datech mit nemusime.

jakubklimek commented 10 years ago

No... je i neni. Konkretne tam je: <obi:NutsLau>CZ0724500011</obi:NutsLau> coz je konkatenace tech dvou, coz neni nic. Ja to rozdelil aby to davalo smysl, ale je fakt ze staci ta druha pulka, no.

martinnec commented 10 years ago

:-) To to tam maji pekne vymyslene