ceskaexpedice / kramerius

System Kramerius
GNU General Public License v3.0
45 stars 26 forks source link

K7 SOLR schema - own_pid_path analyzer index+query - přidat filter LowerCaseFilterFactory #731

Open filak opened 4 years ago

filak commented 4 years ago
    <fieldType name="own_pid_path" class="solr.TextField" positionIncrementGap="100">
        <analyzer>
            <tokenizer class="solr.KeywordTokenizerFactory"/>
            <filter class="solr.LowerCaseFilterFactory"/>
        </analyzer>
    </fieldType>
filak commented 4 years ago

Dotazy s wildcard(*) na pid_path jsou SOLRem vždy vyhodnocovány jako case-sensitive.

Pokud se tedy v uuid řetězcích vyskytnou velká písmena a klient s touto variantou nepočítá tak SOLR nic nenajde...

Výše uvedené nastavení tento problém po reindexaci řeší a to nezávisle na klientovi.

filak commented 2 years ago

Bylo již toto ošetřeno ve schématu ?

pavel-stastny commented 8 months ago

@filak Je potřeba přidávat ? Zatím se na tento problém nenarazilo. Generované pidy mají ždy malá písmena.

filak commented 8 months ago

Jak se říká: better safe than sorry...

Matně si vybavuji, že v nějakých starších datech u replikovaných dokumentů jsem uppercase PIDy viděl.

zabak commented 7 months ago

Až na něco takového někdo narazí, tak to zde můžeme znovu otevřít

zabak commented 7 months ago

tak je jich hodně... :)