Open mtrojan-ub opened 3 years ago
... Ist es korrekt so wie in diesem ("prominenten") Beispiel?: https://134.2.67.9/Authority/1745190449/Details
Wobei hier wahrscheinlich auch nur die Struktur stimmt, wieso genau diese URL in 670u steht ist mir schleierhaft...
Für die Erfassung der Quellen in Feld 670 gilt aktuell diese Vorgabe: 670.pdf
Allerdings war die Erfassung früher deutlich unstrukturierter. Links wurden nach meiner Erinnerung anfangs gar nicht erfasst. Nur die vorgeschriebenen Abkürzungen der offiziellen Liste der Nachschlagewerke oder bibliografische Angaben anderer Quellen (siehe Datei 670.pdf). Einiges wurde maschinell angepasst, anderes muss ggf. "im Ereignisfall" korrigiert werden, d.h. wenn der Satz anderweitg bearbeitet wird. Ob da immer auch die Quelle angepasst wird, bezweifle ich.
Welche (Wikipedia-)Links dort abgelegt werden, hängt vom Rechercheergebnis des jeweiligen Bearbeiters ab. Als Quelle wird halt angegeben, was der Bearbeiter bei den Recherchen auftreiben kann. Wenn das die Webseite von RelBib ist, kann es auch diese Quelle sein.
@mtrojan-ub $u kannst Du immer auswerten, egal ob wikipedia oder etwas anderes.
Darüber hinaus solltest Du schauen, ob es auch in den unstrukturierten Angaben einen wikipedia Link gibt. Den könntest du dann verwenden. Denn der Erfasser hat ja diesen Artikel als Quelle für die Angaben zum Autor verwendet und somit ist das intellektuell geprüft.
Über die Wikidata Daten hinaus könnte das somit eine Ergänzung sein
Der Wikipedia-Link wird jetzt auch unter "External References" angezeigt => ready for testing, Beispiel: https://ptah.ub.uni-tuebingen.de/Authority/035286210
ja, Link wird angezeigt. das ist ok
Können auch die URLs von oben aus der Liste noch genutzt werden? Das wäre bei Datensatz 1, 2 und 4 wünschenswert, da dort folgende Bedingungen vorhanden sind: Ein String fängt mit "http ..." an und enthält "wikipedia.org"
Es gibt nur 237 Einträge auf die diese Bedingung zutrifft, und manche davon sind trotzdem noch unbrauchbar weil sie Suffixe wie Datumsangaben beinhalten die man noch entfernen müsste damit der Link tatsächlich funktioniert. Von daher halte ich das nicht für einen gangbaren Weg.
Ok, da es nur wenige Datensätze sind, lassen wir das @mtrojan-ub Ist es möglich eine Liste auszugeben, in der "falsche" Wikipedia Links in der 670 sind? Dann könnten wir die bereinigen
=> Aktuell 289 Einträge. Es könnte aber sein, dass manche davon beim nächsten Komplettabzug nicht mehr in IxTheo auftauchen.
Notiz fürs nächste Mal, Liste wurde mit diesem Befehl erzeugt:
marc_grep Normdaten-fully-augmented-210921.mrc 'if "670a"=="http://.*ikipedia" extract "670"' > /tmp/670a.txt
Ok. Bevor wir nun allgemeine Datensätze für den K1oplus bereinigen, stellen wir die Bearbeitung bis nach dem nächsten Komplettabzug zurück.
Der SA wurde heute eingespielt. Es sind jetzt noch 112 Datensätze betroffen: 670a.txt
(Vorsicht: Die Datei hat insgesamt 226 Zeilen, mehrere aufeinanderfolgende Zeilen können dabei zur selben PPN gehören.)
@thefass Bitte hier die Priorität festlegen, da wir in Bezug auf Normsätze noch tausende Fälle haben, die überhaupt erst angelegt werden müssen.
Da eine Prüfung und Aufarbeitung zum Teil aufwändig werden kann (auch wenn es "nur" 112 Datensätze sind), halte ich es nicht für prioritär, für Einzel-Problemfälle dafür zu sorgen, dass man aus dem IxTheo-Satz nach Wikipedia kommt. Die kann im Notfall jeder direkt in Wikipedia aufrufen.
Oder hängen andere Funktionalitäten daran? Dann müsste eine Routine aufgebaut werden, die neu hinzu kommende Fälle berücksichtigt.
@mtrojan-ub Die Liste 670a.txt enthält die K10plus PPNs. Normsätze müssen aber direkt in der GND bearbeitet werden. Daher brauchen wir für eine Bearbeitung die GND PPN 035 $a(DE-588), sonst muss jeder einzelne Datensatz zuerst im K10plus aufgerufen, die GND-Nummer kopiert und dann nochmal in der GND aufgerufen werden. Die GND-Nummer ist sowohl im K10plus als auch in der GND recherchierbar.
Hier die Liste der PPNs mit zugehöriger GND Nummer: 035.txt
@IxTheoKm Die Liste ist nicht mehr sonderlich lang. Bitte von jemanden bereinigen lassen
@mtrojan-ub Zum Verständnis: es geht in den gelisteten Normsätzen um die Prüfung und Anpassung aller URLs in den 670er Feldern, nicht nur um die Wikipedia-Links, richtig?
es geht nur um die Wikipedia Links, die anderen links können wir nicht nachhalten, wenn sie nicht mehr auflösen
Korrektur der Wikipedia-Links in den Normsätzen der Liste ist beauftragt.
Korrektur erledigt. Ausnahme: PPN 101651562 = GND 2009323-8 (Bearbeitungssperre Top500-Normsatz). Redaktionsanfrage an DNB läuft. Ablehnung der Korrektur ist aber möglich.
Danke
https://ptah.ub.uni-tuebingen.de/Authority/061939080
Gleiche Problematik wie bei #1544.
Ähnlich #1544
In den bestehenden Normdaten gibt es auch Hinweise zu bereits hinterlegten Wikipedia-Links. Diese sind allerdings i.d.R. sehr heterogen, daher kann die Information (aus 670) nicht sinnvoll verwendet werden.
@IxTheoKm: Können Sie einschätzen wieso diese Werte so heterogen sind? Wie müssten die Informationen korrekt erfasst werden bzw. was wäre hier der SOLL-Zustand?