ceskaexpedice / ceska-digitalni-knihovna

Automatically exported from code.google.com/p/ceska-digitalni-knihovna
6 stars 1 forks source link

Nekonzistence mezi daty v periodiku Květy - ČDK x MZK #69

Open annie-cz opened 3 months ago

annie-cz commented 3 months ago

Jak jinak, nalezeno náhodou ...

Jak prosím aktuálně funguje synchronizace dat mezi knihovnami? Resp. když nějaká knihovna něco změní, tak jak dlouho trvá, než se to propíše?

Když porovnáme reálný stav vs poslední indexaci v solr ...

Info ze SOLR: "indexed": "2024-05-25T12:53:28.241Z", https://ceskadigitalniknihovna.cz/uuid/uuid:1c869c00-535b-11e3-9ea2-5ef3fc9ae867

image

vs

Info ze SOLR: "indexed": "2024-05-25T12:53:28.241Z" https://www.digitalniknihovna.cz/mzk/periodical/uuid:1c869c00-535b-11e3-9ea2-5ef3fc9ae867

image

To mi nevychádza. 😄 Tuší někdo prosím, kde je problém?

annie-cz commented 3 months ago

A teď ještě koukám, že v ČDK jsou vlastně data teoreticky konzistentní ... jen počet ročníků nesedí. Okey, zajímavé. 😄 ČDK nabízí vlastně jakoby tři ročníky navíc, dva jakože digitalizované a přístupné po přihlášení, ale když je člověk rozklikne, tak jeden je prázdný a druhý je pod jinou knihovnou.

1889 - prázdný (u toho nerozumím navíc vlevo té části se zdrojem: při kliknutí na to tlačítko se zdrojem NKP se vpodstatě reloaduje ročník, ale na druhé straně se ukazuje stejně zdroj z MZK) https://ceskadigitalniknihovna.cz/periodical/uuid:15eb5050-48ec-4d07-be71-2779b284cdf4

image

1915 - NKP (zbytek je MZK) - to asi je předpokládám OK z logiky věci, protože MZK tenhle ročník nemá evidentně ve fondu https://ceskadigitalniknihovna.cz/uuid/uuid:d0b1342e-ebf0-4ef6-965a-914c194faa27

zabak commented 3 months ago

@pavel-stastny jak máme tohle ošetřené?

pavel-stastny commented 3 months ago

@zabak @annie-cz Zde je nějaký prapodivný stav jak na straně ČDK tak NKP i MZK.

Inkriminovaný ročník 1889 na straně NDK má jenom jeden výtisk a ten vypadá následovně:

image

Když se na ten samý výtisk podívám na ČDK, tak skočím na ročník 1961 ale datum vydání čísla je 1889

image

Když se podívám do indexu MZK, tak ročník tam není, výtisk tam není, stránky výtisku tam taky nejsou ale data v akubře jsou - dostanu náhled stránky, i metadata:

Náhled stránky: https://api.kramerius.mzk.cz/search/api/client/v7.0/items/uuid:03065410-8b59-11ed-a781-5ef3fcdaa9a7/image/thumb

Metadata stránky: https://api.kramerius.mzk.cz/search/api/client/v7.0/items/uuid:03065410-8b59-11ed-a781-5ef3fcdaa9a7/metadata/dc https://api.kramerius.mzk.cz/search/api/client/v7.0/items/uuid:03065410-8b59-11ed-a781-5ef3fcdaa9a7/metadata/mods

V indexu stránka není: https://api.kramerius.mzk.cz/search/api/client/v7.0/search?q=pid:%22uuid:03065410-8b59-11ed-a781-5ef3fcdaa9a7%22

Vypadá to, že došlo k nějakým přesunům mezi ročníky. Tady asi pomůže jenom reharvest inkrimonovaných ročníků nebo celého periodika.

annie-cz commented 3 months ago

A o co mi jde především ... dá se nastavit nějaký kontrolní proces, aby tam takovéhle nekonzitence a podivnosti nebyly? Tohle je jedna exotika, na kterou jsem narazila náhodou, ale může jich být víc a bylo by super vědět na úrovni ČDK, že tam jsou, aby s tím šlo něco dělat. 🙂

paulusova commented 1 month ago

Nekonzistence jsou tu stále, např. roky 1895, 1900 a 1906 jsou v ČDK prázdné a v roce 1894 je jen jedno číslo. Spraví se to v rámci automatických aktualizací nebo mám sepsat všechny chyby na opravu?

pavel-stastny commented 1 month ago

@paulusova Momentálně jsou pozastavené všechny aktualizace i reharvesty kvůli výkonostním problémům. Až to bude moci, reharvestujeme celé periodikum, tím by se to mělo spravit.

pavel-stastny commented 2 weeks ago

@paulusova @annie-cz @zabak Reharvest proveden.