Closed nichtich closed 1 year ago
Die Hinweise zum Retrieval sind eingearbeitet (nur einige Begriffe und kurze Formulierungen), lediglich beim Hinweis auf "systematische Darstellung von unselbständigen Werken/Zeitschriftenaufsätzen" ist mir nicht klar, wie sich das verallgemeinert in einem Satz ausdrücken lässt (unter Frontend oder Anreicherungsdienste?) Ich denke der Aspekt ist auch zu speziell, da das Handbuch nur einen Überblick geben soll.
Anreicherungsdienste
Beim Absatz "Anreicherungsdienste" erwähnen Sie/das Autorenteam zwar Inhaltsverzeichnisse, aber listen diese nicht bei den häufigen Diensten auf. Allein der K10plus hat über 5 Mio TOCs - fast 3 Mio direkt oder indirekt (DNB, Casalini, dandelon/AGI mit Non-GBV-Bibliotheken und unsere GBV-Bibliotheken) kommen aus unserem Produktionsverfahren. Die DNB strebt nahe 100 % an. Laut Klick-Statistik von Herrn Diedrichs (GBV), werden die TOC-Links am häufigsten genutzt.
Doch es geht bei TOCs überhaupt nicht um Verlinkung und Anzeige auf etwas zusätzliches, sondern daraus ergeben sich für die Retrieval-Systeme erst die Basis für Gewichtung - bibliografische Angaben oder Cover allein gestatten kein plausibles Ranking.
Recommender-Systeme bieten eine weitere "Ranking"-Methode - Click-Statistik unabhängig vom Inhalt. Hier liegt eine der vielen Stärken von Google.
Zitationsstatistik wie Science Citation Index ist eine dritte "Ranking"-Methode für Retrieval-Systeme - mühsam in der Implementierung und Produktion.
Erwähnen würde ich neben SOLR auch ElasticSearch - ein Vergleich: https://sematext.com/blog/solr-vs-elasticsearch-differences/
Das Problem der vielen Sprachen lösen wir, indem wir aus n Quellsprachen nach m Zielsprachen das jeweilige Medium übersetzen, primär Titel, intellektuelle und maschinelle Deskriptoren.
Eine systematische Darstellung von unselbständigen Werken/Zeitschriftenaufsätzen im Heft und über Ausgaben hinweg ist durchaus möglich in einer Retrieval-Implementierung: https://dandelon.com/#/search/query=*&work_type=Article