ceskaexpedice / kramerius

System Kramerius
GNU General Public License v3.0
45 stars 26 forks source link

K7 / problém se search kolekcí na novém Solr 9.7.0 v SolrCloudu #1091

Open mduda100871 opened 2 months ago

mduda100871 commented 2 months ago

Zdravím,

pro search index používám u K7 plnohodnotný třínodový SolrCloud, aktuálně s verzí Solru 9.6.1 jako Docker image od Bitnami (Zookeeper rovněž od Bitnami verze 3.9):

https://github.com/bitnami/containers/blob/main/bitnami/solr/README.md

víceméně bez problému (přes 5 miliónů objektů).

Verze 9.6.1 byla zároveň dlouho také jako bitnami/solr:latest. Nicméně nedávno, cca pár dní zpět, došlo k tomu, že latest verzí se stal Solr verze 9.7.0, z čehož plyne, že předchozí verze se stane neudržovanou.

Zkusil jsem tedy svou instanci SolrCloudu se Solrem verze 9.6.1 nahradit verzí novou. Pro jistotu jsem si udělal kompletní zálohu všech tří nodů clusteru (ještě že jsem to udělal) a následně, dle doporučení, jsem začal postupně migrovat jeden Solr za druhým.

Po prvním nodu to nejprve vypadalo dobře, ale po synchronizaci začaly vypadávat chybové hlášky, a při pokusu vyhledat data to nic nevracelo, jen hlášku:

solr-9 7 0-err-00

select-err.json.zip

Přímo v logu Solru pak vypadává výjimka:

solr-log-err

solr-9.7.0.log.zip

přestože cluster se "tváří zeleně" - všechny repliky dostupné atd.

Podle dokumentace:

https://solr.apache.org/guide/solr/latest/upgrade-notes/major-changes-in-solr-9.html#solr-9-7

to asi vypadá na nějaké zásadnější změny, což mě vede k myšlence, zda-li naše indexovací schéma pro kolekci search nebude potřeba aktualizovat/modifikovat.

Je zajímavé, že pro ostatní kolekce processing, logs, sdnnt-sync se tento problém neukazuje - přičítám to zatím tomu, že výše uvedené kolekce jsou na jednonodovém clusteru, pouze s jedním shardem a replikou.

MD