ceskaexpedice / kramerius-googlecode-backup

Automatically exported from code.google.com/p/kramerius
0 stars 1 forks source link

dotaz na vyhledavani #13

Closed GoogleCodeExporter closed 9 years ago

GoogleCodeExporter commented 9 years ago
trosku jsem laboroval s kodovanim pro ocr

vcera jsem v ramci testu nahral pro 'slovo a slovesnost' rok 1941 volume VII
(txt v kodovani utf8)

pro prvni stranku 'obsah'
uuid:94a63b97-e692-11df-9ebb-001aa000c505/datastreams/IMG_FULL/content
uuid:94a63b97-e692-11df-9ebb-001aa000c505/datastreams/TEXT_OCR/content

kdyz zadam napriklad slovo 'románských' s diaktritikou se mi vrati nula 
vysledku a navic slovo v vyhledavacim policku se mi zmeni (viz obrazek v 
priloze)

zkusmo jsem zadal hledat 'slov v' a hned jako druhy vysledek vidim danou stranku

nejak se mi bohuzel nepodarilo prijit na to jestli jsem neco udelal spatne ja 
nebo je chyba nekde jinde?

Original issue reported on code.google.com by s...@lib.cas.cz on 3 Nov 2010 at 10:16

Attachments:

GoogleCodeExporter commented 9 years ago

Original comment by vlah...@gmail.com on 3 Nov 2010 at 11:03

GoogleCodeExporter commented 9 years ago

Original comment by vlah...@gmail.com on 13 Jan 2011 at 7:38

GoogleCodeExporter commented 9 years ago
V konfiguraci tomcatu server.xml musí byt attribute URIEncoding="UTF-8" v 
connector

Original comment by alberto....@gmail.com on 13 Jan 2011 at 8:18

GoogleCodeExporter commented 9 years ago

Original comment by alberto....@gmail.com on 13 Jan 2011 at 8:21

GoogleCodeExporter commented 9 years ago
bohuzel toto nastaveno mame. nejdrive jsem myslel ze je problem v apachi kdyz 
volam aplikaci na portu 80. dnes jsem zkusil hledani s diakritikou na portu 
8080 a bohuzel problem stale pretrvava (podle me to ale pred instalaci balicku 
pred konferenci k4 nedelalo)

Original comment by s...@lib.cas.cz on 20 Jan 2011 at 1:31

GoogleCodeExporter commented 9 years ago
podíval jsem se znovu a lépe do konfigurace tomcatu na devel.lib.cas.cz, 
URIEncoding sice nastaveno bylo, ale současně bylo nastaveno neobvyklé 
useBodyEncodingforURI="true" , po odstranění této volby už čeština funguje

Original comment by vlah...@gmail.com on 20 Jan 2011 at 3:01