mff-uk / odcs-dpus

Repository for DPUs (Data processing units) for ETL tool for RDF data
3 stars 2 forks source link

nsoud - potrebujeme vedet, jake odkazy na zakony se nenaparsovali #44

Closed martinnec closed 10 years ago

martinnec commented 10 years ago

Je nutné nějak zajistit, abychom vědeli, co Kubův parser nenaparsoval. Zřejmě ho budeme muset upravit tak, aby nenaparsovaným textchunkům dal nějakou propertu, která bude říkat, že nebyly naparsovány a dá také jejich původní textový obsah, abychom to viděli. Budeme pak schopni si vyjet nenaparsované textchunky z judikátů a podle nich upravit seznam zkratek a Kubův parser. Tak prosím rozšiř příslušné DPU. Není ale třeba kvůli tomu sjíždět už udělané judikáty - budeme to sledovat zatím jen na nových.

tomas-knap commented 10 years ago

Aktualne je to upravene tak, ze vsechny textchunky maji i dcterms:Description. Takze je pak mozne se podivat, jake textchunky nemaji anotaci.