slovak-egov / centralny-model-udajov

Centrálny model údajov verejnej správy vo forme RDF znalostného grafu
https://znalosti.gov.sk
1 stars 1 forks source link

Vytvorenie RDF modelu pre dataset Počty zamestancov a vytvorených pracovných miest #7

Closed miroslavliska closed 7 months ago

miroslavliska commented 10 months ago

Prikladám vzorový dataset TK_Počty zamestnancov a vytvorených pracovných miest.xlsx

miroslavliska commented 7 months ago

Pridávam požadované doplnenia: image

miroslavliska commented 7 months ago

Takže toto bolo dosť prepracované, zlepšilo sa použitie ontológie pre štatistiku RDF DataCube, čo nakoniec zjednodušilo aj podobu štatistík. Dátové štruktúru v tomto prípade sú zámerne tabuľkového formátu, a je potrebné správne zadefinovať dátovú kocku ku každému datasetu.

Linka na stiahnutie je: https://github.com/slovak-egov/centralny-model-udajov/blob/develop/abox/govdata-examples/central-economical-system/employees-jobs-observations.rdf.xml

image

Na základe existujecej špecifikácie štatitiky Počty zamestanncov - tzv. technická karta sa presne hodina na definíciu štruktúry datasetu qb:DataStructureDefinition, ktorá je v tomto súbore: https://github.com/slovak-egov/centralny-model-udajov/blob/develop/abox/govdata-examples/central-economical-system/employees-jobs-cubestructure.rdf.xml čo je rdf forma technickej karty štatistického datasetu.

Samotné dáta sú reprezentované ako namerané hodnoty - qb:Obsevation https://github.com/slovak-egov/centralny-model-udajov/blob/develop/abox/govdata-examples/central-economical-system/employees-jobs-distribution.rdf.xml

Informáciu, že nejaký dataset má dátovú štruktúru je realizovaný cez vzťah qb:structure .Táto vlastnosť je nepovinná v rámci pripravovanej novej verzie štandardu DCAT-AP-SK-2.0.1 Priklad ako reprezentovat metadata datasetu a jeho odkazu na štrukturú je dostupný tu: https://github.com/slovak-egov/centralny-model-udajov/blob/develop/abox/govdata-examples/central-economical-system/employees-jobs-dataset.rdf.xml

miroslavliska commented 7 months ago

Na zaklade analyzy prikladov datovych kociek dojde este k malej zmene definicie dimenzii kocky ako aj suboru distribucie s vysledkami. Rozdiel bude v nahradeni kodov priamo URIčkam. Zajtra predpokladám že by to malo byť hotové.

miroslavliska commented 7 months ago

Zmena hotová. Zatváram task. Ak budú pripomienky, znova ho otvorím.