NLCR / registrdigitalizace

Národní knihovna - Registr Digitalizace
4 stars 2 forks source link

přeindexovat vyhledávání - špatné počty záznamů u ABA001-DK a BOA001-DK #689

Closed helena-oks closed 5 years ago

helena-oks commented 5 years ago

Záznamy se opět špatně přiřazují k digitálním knihovnám. Opět nefunguje to, co jsem požadovala napravit v issue #679. (Issue jsem znovu otevřela a v commentu popsala situaci).

Bude třeba přeindexovávat periodicky???

albertoh commented 5 years ago

Nemelo by byt potreba. Zkoumam proc to mizi.

albertoh commented 5 years ago

Chyba byla zpusobena nastaveni letniho casu na serveru a indexu. Ted by to melo reindexovat automaticky spravne. Index je nyni aktualizovan.

helena-oks commented 5 years ago

Počty záznamů zhruba odpovídají, takže issue by se mohlo uzavřít. Ale objevila jsem chybu, o níž nemůžu říct, jestli před indexováním byla nebo nebyla:

Neplatí, že přidělení druhé DK se týká pouze záznamů, které mají kód financování iop nebo ndk-u!

V BOA001-DK je cca 8.000 záznamů, které mají vlastníka ABA001 a financování NorskeFondy - ty mají být pouze v ABA001-DK. Otevřela jsem proto #669.

albertoh commented 5 years ago

Takze podminka pro propojeny je: 1.- pokud zaznam ma financovano=iop nebo financovano=iop-ndku a digknihovna=ABA001-DK pridam digknihovna BOA001-DK 2.- pokud zaznam ma financovano=iop nebo financovano=iop-ndku a digknihovna=BOA001-DK pridam digknihovna ABA001-DK

Je to tak?

helena-oks commented 5 years ago

Základní požadavek přesněji: 1/ je-li sigla1=ABA001 a (financovano=iop nebo financovano=iop-ndku), pak k uuid ze sklizně vyrobit 2 URL - jedno s prefixem pro ABA001-DK a druhé pro BOA001-DK 2/ je-li sigla1=BOA001 a (financovano=iop nebo financovano=iop-ndku), pak k uuid ze sklizně vyrobit 2 URL - jedno s prefixem pro ABA001-DK a druhé pro BOA001-DK

Pokud by to šlo, tak navíc toto pro případy, kdy se uuid nenapojilo na předlohu a máme URL v datech předlohy:

3/je-li sigla1=ABA001 a (financovano=iop nebo financovano=iop-ndku) a je (URL nebo URLtitul) s prefixem pro ABA001-DK (jiný prefix ne!), pak vyrobit další URL, kde bude před uuid prefix pro BOA001-DK 4/je-li sigla1=BOA001 a (financovano=iop nebo financovano=iop-ndku) a je (URL nebo URLtitul) s prefixem pro BOA001-DK (jiný prefix ne!), pak vyrobit další URL, kde bude před uuid prefix pro ABA001-DK

albertoh commented 5 years ago

Reindexovano podle 1/ a 2/.

helena-oks commented 5 years ago

Započítávání do DK je asi v pořádku, ale linky do MZK se generují i v případech, kdy kvůli financování záznam od ABA001 do BOA001-DK nepatří. Dokument v ukázce je dig. z Norských fondů (proto je i ve staré digitalizaci). Je v ABA001-DK (sklizeno a připojeno uuid), není v BOA001-DK (a nemá tam být) – ale vytvořil se z uuid SLEPÝ link do mzk! screta

albertoh commented 5 years ago

Opraveno.

helena-oks commented 5 years ago

Díky, vypadá to dobře! Zkusíte obdobně nastavit též 3 a 4?

helena-oks commented 5 years ago

Příklady, kde by měla být přidána DK a kde by měly být 2 URL:

albertoh commented 5 years ago

3 a 4 implementovano. Otestujte, prosim.

helena-oks commented 5 years ago

Vypadá to dobře, co do počtu i konkrétní odkazy. Jen se nám možná takto zpracovávají i záznamy, co financování nemají nebo mají financování "vlastní", ale to je možná způsobeno špatnými daty, nebo že už tam odkazy do obou DK byly. Nejdřív to prozkoumám, zatím nastavení neměnit.

helena-oks commented 5 years ago

Děkuji, teď se to chová zcela podle podle požadavků, odchylky způsobují nepříliš korektní data.