ceskaexpedice / kramerius-googlecode-backup

Automatically exported from code.google.com/p/kramerius
0 stars 1 forks source link

Chyba při reindaxaci periodika #634

Closed GoogleCodeExporter closed 9 years ago

GoogleCodeExporter commented 9 years ago
Po konverzi periodika z K3 do K4 jsme zjistili, ze doslo k preházení 
ročníků. Opravili jsme pořádí v Editoru a poté spustilu Reindaxaci. Ta 
však skončila jako FAILED (chybový log přikládám)
Podle logu nebylo nalezeno jedno UUID, ktere patri jednomu vytisku. Dival jsem 
se do Fedory a tam se mi dane UUID vyhledalo. Take v puvodnim XML z K3 je dane 
UUID.
Ted se zobrazuji v K4 jen rocniky a vytisky az po ten chybejici.
Bude nutné celé periodikum smazat a znovu zkonvertovat?

Original issue reported on code.google.com by tolner...@gmail.com on 26 Nov 2013 at 8:46

Attachments:

GoogleCodeExporter commented 9 years ago
Skutečným důvodem není chybějící FOXML objekt, ale jeho obsah. Některý 
z jeho datastreamů obsahuje příliš velké množství xml entit (zřejmě 
zakódované české znaky?) a indexer ten objekt nedokáže načíst, aspoň 
to tvrdí tato kořenová výjimka:
Message: JAXP00010001: The parser has encountered more than "64000" entity 
expansions in this document; this is the limit imposed by the JDK.

Zkuste prosím prohlédnout ten objekt s 
uuid:62395190-7fd8-11dd-aa4b-0013d398622b a případně upravit jeho obsah tak, 
aby neobsahoval tolik xml entit.

Original comment by vlah...@gmail.com on 5 Dec 2013 at 9:00

GoogleCodeExporter commented 9 years ago

Original comment by vlah...@gmail.com on 6 Jan 2014 at 5:26