Open annie-cz opened 3 months ago
A teď ještě koukám, že v ČDK jsou vlastně data teoreticky konzistentní ... jen počet ročníků nesedí. Okey, zajímavé. 😄 ČDK nabízí vlastně jakoby tři ročníky navíc, dva jakože digitalizované a přístupné po přihlášení, ale když je člověk rozklikne, tak jeden je prázdný a druhý je pod jinou knihovnou.
1889 - prázdný (u toho nerozumím navíc vlevo té části se zdrojem: při kliknutí na to tlačítko se zdrojem NKP se vpodstatě reloaduje ročník, ale na druhé straně se ukazuje stejně zdroj z MZK) https://ceskadigitalniknihovna.cz/periodical/uuid:15eb5050-48ec-4d07-be71-2779b284cdf4
1915 - NKP (zbytek je MZK) - to asi je předpokládám OK z logiky věci, protože MZK tenhle ročník nemá evidentně ve fondu https://ceskadigitalniknihovna.cz/uuid/uuid:d0b1342e-ebf0-4ef6-965a-914c194faa27
@pavel-stastny jak máme tohle ošetřené?
@zabak @annie-cz Zde je nějaký prapodivný stav jak na straně ČDK tak NKP i MZK.
Inkriminovaný ročník 1889 na straně NDK má jenom jeden výtisk a ten vypadá následovně:
Když se na ten samý výtisk podívám na ČDK, tak skočím na ročník 1961 ale datum vydání čísla je 1889
Když se podívám do indexu MZK, tak ročník tam není, výtisk tam není, stránky výtisku tam taky nejsou ale data v akubře jsou - dostanu náhled stránky, i metadata:
Náhled stránky: https://api.kramerius.mzk.cz/search/api/client/v7.0/items/uuid:03065410-8b59-11ed-a781-5ef3fcdaa9a7/image/thumb
Metadata stránky: https://api.kramerius.mzk.cz/search/api/client/v7.0/items/uuid:03065410-8b59-11ed-a781-5ef3fcdaa9a7/metadata/dc https://api.kramerius.mzk.cz/search/api/client/v7.0/items/uuid:03065410-8b59-11ed-a781-5ef3fcdaa9a7/metadata/mods
V indexu stránka není: https://api.kramerius.mzk.cz/search/api/client/v7.0/search?q=pid:%22uuid:03065410-8b59-11ed-a781-5ef3fcdaa9a7%22
Vypadá to, že došlo k nějakým přesunům mezi ročníky. Tady asi pomůže jenom reharvest inkrimonovaných ročníků nebo celého periodika.
A o co mi jde především ... dá se nastavit nějaký kontrolní proces, aby tam takovéhle nekonzitence a podivnosti nebyly? Tohle je jedna exotika, na kterou jsem narazila náhodou, ale může jich být víc a bylo by super vědět na úrovni ČDK, že tam jsou, aby s tím šlo něco dělat. 🙂
Nekonzistence jsou tu stále, např. roky 1895, 1900 a 1906 jsou v ČDK prázdné a v roce 1894 je jen jedno číslo. Spraví se to v rámci automatických aktualizací nebo mám sepsat všechny chyby na opravu?
@paulusova Momentálně jsou pozastavené všechny aktualizace i reharvesty kvůli výkonostním problémům. Až to bude moci, reharvestujeme celé periodikum, tím by se to mělo spravit.
@paulusova @annie-cz @zabak Reharvest proveden.
Jak jinak, nalezeno náhodou ...
Jak prosím aktuálně funguje synchronizace dat mezi knihovnami? Resp. když nějaká knihovna něco změní, tak jak dlouho trvá, než se to propíše?
Když porovnáme reálný stav vs poslední indexaci v solr ...
Info ze SOLR: "indexed": "2024-05-25T12:53:28.241Z", https://ceskadigitalniknihovna.cz/uuid/uuid:1c869c00-535b-11e3-9ea2-5ef3fc9ae867
vs
Info ze SOLR: "indexed": "2024-05-25T12:53:28.241Z" https://www.digitalniknihovna.cz/mzk/periodical/uuid:1c869c00-535b-11e3-9ea2-5ef3fc9ae867
To mi nevychádza. 😄 Tuší někdo prosím, kde je problém?