@witzigs @guenterh
... eine alte Sache, wieder aktuell durch die Indexierung von Inhaltsverzeichnissen der PZ.BS. Von Bibliotheken gescannte Inhaltsverzeichnisse in pdf erhalten oft einen standardmässigen Header oder Footer. Dieser Text sollte bei der Volltextindexierung ausgefiltert werden.
Der Text "Erziehungsdepartement des Kantons Basel-Stadt Pädagogisches Zentrum PZ.BS Bibliothek"
s. die solr-Suche: [host]/solr/sb-biblio/select?q=%2Binstitution%3AA342+%2Bfulltext%3AErziehungsdepartement&rows=100&fl=id%2C+fulltext&wt=xml&indent=true
Thema
@witzigs @guenterh ... eine alte Sache, wieder aktuell durch die Indexierung von Inhaltsverzeichnissen der PZ.BS. Von Bibliotheken gescannte Inhaltsverzeichnisse in pdf erhalten oft einen standardmässigen Header oder Footer. Dieser Text sollte bei der Volltextindexierung ausgefiltert werden.
Beispiele