ceskaexpedice / ceska-digitalni-knihovna

Automatically exported from code.google.com/p/ceska-digitalni-knihovna
6 stars 1 forks source link

ČDK - úpravy sklízecího procesu #36

Closed mduda100871 closed 1 year ago

mduda100871 commented 3 years ago

Zdravím,

je potřeba přidat další parametr pro sklízecí proces, který bude sloužit k nastavení FQDN sklízeného serveru s Krameriem.

Tímto parametrem budou nahrazeny/přetíženy veškeré adresy ve sklízených FOXML, konkrétně jde zejména o datastream RELS-EXT a v něm vnořené elementy:

<tiles-url/>
<replicatedFrom/>

Příklady

původní obsah elementu:

<tiles-url>http://kramerius.nekde.cz:443/search/zoomify/uuid:9f7f8ec3-443e-11eb-836c-00505684fda5</tiles-url>

bude přepsán "natvrdo" hodnotou, předanou jako parametr procesu, například takto:

<tiles-url>https://kramerius.nekde.cz/search/zoomify/uuid:9f7f8ec3-443e-11eb-836c-00505684fda5</tiles-url>

Bylo by zároveň dobré, kdyby opakované spuštění sklízecího procesu nad stejnou množinou dat, provedlo "merge" nejen na úrovni RELS-EXT vazeb na potomky, ale zároveň opravilo obsah výše zmíněných elementů na základě předaného parametru, v tomto případě FQDN serveru.

MD

pavel-stastny commented 3 years ago

@mduda100871 Zrizena konfiguracni promenna, ktera mapuje prepisovane hodnoty. Priklad:

cdk.prepareFOXML.relsext.forceReplaceHosts=http://kramerius.nekde.cz:443-https://kramerius.nekde.cz;http://kramerius.dda.cz:443-http://kramerius.dde.cz

mduda100871 commented 3 years ago

Po nasazení nového sklízeče úspěch zatím jen částečný.

Do FOXML, do RELS-EXT datastreamu se sice doplní opravený link, ale pouze tak, že se přidá jen další element z výše uvedených, nicméně ten původní špatný tam zůstane. To není dobré, viz screenshot:

foxml-00

Je potřeba, aby se špatný obsah elementu buď nahradil tím co je uvedeno v příslušné propertě, nebo aby se celý element smazal a pak vložil znovu s validním obsahem.

Platí to samozřejmě pro oba výše uvedené elementy.

MD