mff-uk / odcs-dpus

Repository for DPUs (Data processing units) for ETL tool for RDF data
3 stars 2 forks source link

[INTLIB] vazby mezi pojmy zcela nekompletni #70

Closed martinnec closed 10 years ago

martinnec commented 10 years ago

Zda se, ze v transformaci se ztraci temer vse, co Vincent extrahoval :-(

1) lexc:hasDefinition by mel vypadnout z queries 3-7. Vincent ma 870 definic. Ty mas jen 72

PREFIX skos: http://www.w3.org/2004/02/skos/core# PREFIX frbr: http://purl.org/vocab/frbr/core# PREFIX oa: http://www.w3.org/ns/oa# PREFIX lingv: http://purl.org/lingv/ontology# PREFIX lexc: http://purl.org/lex/ontology/concepts#

SELECT COUNT(?s) WHERE { ?s lexc:hasDefinition ?o . }

2) lexc:hasObligation by mel vypadnout z queries 50-53. Vincent ma 843 obligations. Ty mas jen 67

tomas-knap commented 10 years ago

[5/6/14 10:40:00 PM] Martin Necasky: je mozny, ze se prevodem do RDF neco slije, ale ze by si z vincentovych 870 definic udelal jen 72 mi prijde divny [5/6/14 10:41:50 PM] Martin Necasky: tak jsem si otevrel vincentuv soubor desc-1991-563.xml [5/6/14 10:42:15 PM] Martin Necasky: a prochazim si jeho textchunk ids v elementech [5/6/14 10:42:38 PM] Martin Necasky: treba textchunk 1270 mas spravne prevedenj [5/6/14 10:43:58 PM] Martin Necasky: ale radu dalsich ne, treba 1273 - v RDF mas jen ze ten textchunk existuje, ma hasForm a hasTree, ale to je vse [5/6/14 10:44:04 PM] Martin Necasky: zadna reprezentace Vincentova triple [5/6/14 10:44:09 PM] Martin Necasky: a pritom v tom xml souboru je [5/6/14 10:44:16 PM] Martin Necasky: takze jako by ti to nekde padalo nebo nevim

tomas-knap commented 10 years ago

souvisi i s https://github.com/mff-uk/DPUs/issues/68

martinnec commented 10 years ago

spravnej textchunk: http://internal.opendata.cz:8890/describe/?url=http://linked.opendata.cz/resource/legislation/cz/expression/1992/337-1992/version/cz/1992-05-05/textchunk/1270.0

ale treba tady tomu evidentne neco chybi: http://internal.opendata.cz:8890/describe/?url=http://linked.opendata.cz/resource/legislation/cz/expression/1992/337-1992/version/cz/1992-05-05/textchunk/1273.0

tomas-knap commented 10 years ago

Graph http://linked.opendata.cz/resource/dataset/legislation/lingv-lex/2014-05-08 727

tomas-knap commented 10 years ago

Vincent pracuje s 28 soubory, ja s 23, bo nektere nejsou upravene dle posledni domluvy cislovani textchunku.

tomas-knap commented 10 years ago

Pokud najdes nejaky problem, tedy definici, ktera tam chybi, udelej issue