ubtue / tuefind

Tuebingen University's derivatives of VuFind. Contains former versions like IxTheo, RelBib and KrimDok.
GNU General Public License v2.0
6 stars 4 forks source link

Vermischung von Spezialsammlungen #2772

Open IxTheoKm opened 7 months ago

IxTheoKm commented 7 months ago

Wenn ein Datensatz gleichzeitig Bestand von mehreren Spezialsammlungen ist, werden diese ineinander gemischt: (Hier die Franckeschen Stiftungen zu Halle und REMID Marburg)

Spezialsammlungen

https://ixtheo.de/Record/130134627?sid=94356433#details

Die Sammlungen sind in Feld LOK 866 durch Semikolon getrennt:

Spezialsammlungen2

IxTheoKm commented 7 months ago

Zusätzlich ist in den Lokaldaten LOK 935 das Abrufzeichen RFBW für eine dritte Spezialsammlung (Reformationsgeschichtliche Forschungsbibliothek Wittenberg) enthalten, für die aber nichts in LOK 866 abgelegt wurde:

Spezialsammlungen3

Ich finde für "bips" keine Datensätze mit "Bibliothek des Evangelischen Predigerseminars". @socheres Ist es Absicht, dass bei RFBW die Untersammlungen meist nicht in Feld LOK 866 abgelegt wurden?

IxTheoKm commented 7 months ago

Nebenbefund: Der Name lautet offiziell "Bibliothek der Franckeschen Stiftungen" (im Plural), nicht "...Stiftung".

Evtl. per Putzprogramm in Feld 866 vom BSZ korrigieren lassen?

jriedl commented 7 months ago

Auf Bitte von @socheres wurden die Facette auf ub16 deaktiviert.

Die Sammlungen sind in Feld LOK 866 durch Semikolon getrennt:

Code kann so angepasst werden, dass er damit umgehen kann, allerdings fügt sich das aber doch relativ schlecht in die sonstige MARC-Feld-Systematik. Falls es also noch nicht großflächig so eingeführt wurde - warum kein weiteres $x oder ein neues LOK 866?

IxTheoKm commented 6 months ago

Weiterer Zufallsfund: https://ixtheo.de/Record/536865698?sid=95142928#details (siehe https://github.com/ubtue/tuefind/issues/2772#issuecomment-2020895987)

Hier sind Abrufzeichen aus derselben Spezialsammlung mit jeweils verschiedenen Untersammlungen in zwei getrennten TUIXTH-Exemplarsätzen abgelegt (eigentlich legen wir nur einen TUIXTH-Exemplarsatz an).

Der Exemplarsatz mit Abrufzeichen ulbm hat Feld 866, der zweite mit bips ist ohne Feld 866.

jriedl commented 3 months ago

Auf Bitte von @socheres wurde die Facette auf ub16 nun wieder aktiv geschaltet.

IxTheoKm commented 3 months ago

Das o.g. Beispiel https://ixtheo.de/Record/130134627?sid=94356433#details sieht für mich jetzt okay aus. S.a. Facette Spezialsammlungen für https://ixtheo.de/Search/Results?lookfor=mennonitische+geschichtsbl%C3%A4tter&type=AllFields

Insgesamt müsste das @socheres bewerten.

@socheres: bitte im K10plus die Exemplarsätze von PPN 536865698 prüfen. Wir legen nur einen Exemplarsatz an. Soll ich zusammenführen?

IxTheoKm commented 1 month ago

Die Franckeschen Stiftungen werden jeweils mit abweichenden Treffermengen doppelt angezeigt: Spezialsammlungen 2024-09-06

mtrojan-ub commented 1 month ago

Das liegt an den Daten, "Franckesche Stiftung" vs "Franckesche Stiftungen".

socheres commented 1 month ago

Die Daten wurden BSZ-seitig bereinigt. Daher könnt ihr die Übergangslösung wieder aus dem Code rausnehmen. Danke!

socheres commented 1 month ago

https://ixtheo.de/Record/642630151?sid=117879771#details Indexierung scheint noch auf dem alten Stand zu sein. In der K10+ ist sie korrekt (Korrekturdatum 5.9.):

[ILN: 2019 ELN: TUIXTH] IXTHEO< Tü 135 >
E001 27-03-23 : l01
4802 SPQUE#Bibliothek der Franckeschen Stiftungen
7100 $BTü 135$Jn
7901 TUIXTH:27-03-23
7902 27-03-23
7903 05-09-24 08:28:29.000
8012 FRST
7800 4297508044
mtrojan-ub commented 1 month ago

Da sich die Änderung nur auf Lokaldaten bezieht => müssen die Datensätze noch scheinkorrigiert werden damit sie nochmal an uns ausgespielt werden? Die Korrektur ist ja scheinbar am 5.9. erfolgt und war weder in den bisherigen TAs noch in Sekkor o.Ä. von September enthalten.

mtrojan-ub commented 1 month ago

Wie im Meeting besprochen:

IxTheoKm commented 3 weeks ago

Die Vermischungen und Doppelungen sind nun raus. Eigentlich könnte dieses Issue gelöscht werden. Bleibt noch die offene Frage von https://github.com/ubtue/tuefind/issues/2772#issuecomment-2242461603:

@socheres: bitte im K10plus die Exemplarsätze von PPN 536865698 prüfen. Wir legen nur einen Exemplarsatz an. Soll ich zusammenführen?

socheres commented 3 weeks ago

Die Vermischungen und Doppelungen sind nun raus. Eigentlich könnte dieses Issue gelöscht werden. Bleibt noch die offene Frage von #2772 (comment):

@socheres: bitte im K10plus die Exemplarsätze von PPN 536865698 prüfen. Wir legen nur einen Exemplarsatz an. Soll ich zusammenführen?

Ja, bitte E001/E002 zusammenführen. Hat keine Auswirkung auf die Anzeige.

IxTheoKm commented 2 weeks ago

Zusammenführung der Exemplarsätze ist erledigt. Leider kann ich trotzdem noch nicht schließen.

@socheres Es gibt noch weitere Doppelungen in der Spezialsammlungsfacette:

Hier fehlt zur Unterscheidung in der Anzeige die Systematik X C, X D und X E:

Tholuk 2024-10-14 111615

Zwei Sammlungs-Einträge:

(in einem Fall wurde 866 doppelt zusätzlich mit der übergeordneten Slg. erfasst, im andern nur einmal 866) Bsp.: PPN 141183357 PPn 379181517 JALB Ritzaeus 2024-10-14 111811

Moeller/Möller getrennt, obwohl die Erfassung Moeller lautet

Ficker/Johannes Ficker, obwohl im K10plus Johannes Ficker erfasst ist

Kawerau/Gustav Kawerau, obwohl im K10plus Gustav Kawerau erfasst ist

Moeller Ficker Kawerau 2024-10-14 111913

Dissertation/Dissertationen, obwohl im K10plus Dissertationen erfasst ist

Mahlmann 2024-10-14 112142

Bei 4 Datensätzen ist "FRST" am Ende zusätzlich ergänzt (Falscherfassung; habe ich korrigiert): 1666340367, 1693815222, 1804778230, 62542557X FRST Schles 2024-10-14 113020

coeh commented 2 weeks ago

Falls es für die Problemsuche hilft: Die doppelten Fälle sind nach meiner Erinnerung welche, bei denen mir Fehler/Uneinheitlichkeiten in der Benennung aufgefallen waren und Chang-whae Kim daraufhin für nachträgliche Korrektur gesorgt hat. Richtig sind jeweils die im K10plus erfassten Angaben: Moeller, Johannes Ficker, Gustav Kawerau, Dissertationen. Das gleiche gilt für die im vorigen Kommentar noch nicht genannte Untersammlung "Albert Rizaeus Hardenberg" der Johannes a Lasco Bibliothek (doppelt als [richtig] "Albert Rizaeus Hardenberg" und [falsch] "Albert Ritzaeus Hardenberg").

socheres commented 2 weeks ago

Die korrigierten Datensätze in K10plus lasse ich scheinkorrigieren. Dann müsste beim nächsten Import alles richtig rüberkommen.

socheres commented 2 weeks ago

Zusammenführung der Exemplarsätze ist erledigt. Leider kann ich trotzdem noch nicht schließen.

@socheres Es gibt noch weitere Doppelungen in der Spezialsammlungsfacette:

Hier fehlt zur Unterscheidung in der Anzeige die Systematik X C, X D und X E:

Tholuk 2024-10-14 111615

Hier liegt das Problem nicht bei den Datensätzen, sondern die Systematiken X C, X D und X E haben laut Vorlage die gleiche Klassenbenennung

IxTheoKm commented 2 weeks ago

Zusammenführung der Exemplarsätze ist erledigt. Leider kann ich trotzdem noch nicht schließen. @socheres Es gibt noch weitere Doppelungen in der Spezialsammlungsfacette:

Hier fehlt zur Unterscheidung in der Anzeige die Systematik X C, X D und X E:

Tholuk 2024-10-14 111615

Hier liegt das Problem nicht bei den Datensätzen, sondern die Systematiken X C, X D und X E haben laut Vorlage die gleiche Klassenbenennung

Und wozu gibt es dann die Unterscheidung zwischen den Systematiken in Feld 866? 866 $xSPQUE#Bibliothek der Franckeschen Stiftungen#SPSAM#Tholuck-Bibliothek#SPSYS#thol_systematik_X_C 866 $xSPQUE#Bibliothek der Franckeschen Stiftungen#SPSAM#Tholuck-Bibliothek#SPSYS#thol_systematik_X_D 866 $xSPQUE#Bibliothek der Franckeschen Stiftungen#SPSAM#Tholuck-Bibliothek#SPSYS#thol_systematik_X_E

Wenn bei allen drei Einträgen in der Sammlungsfacette nur "Altes Testament Kommentare" steht, hilft das einem Nutzer bei der Recherche nicht weiter. Müsste dort nicht irgendetwas zur Differenzierung stehen, sprich: was sich hinter X C, X D und X E verbirgt?

IxTheoKm commented 1 week ago

Noch eine Fundsache: 33 Titel mit 866 $xSPQUE#Bibliothek der Franckeschen Stiftungen#SPSAM#Bibliothek Walter Beltz#SPSYS#belt_systematik_Ga enthalten in der Facette gar keine Angabe:

FRST_20241021