StabiBerlin / sbb-relevance-test

Specs for relevance of stabikat search
MIT License
3 stars 1 forks source link

Chronologisch absteigend #11

Open annekauf opened 10 months ago

annekauf commented 10 months ago

Bei allen Suchanfragen: Trefferliste soll nach Erscheinungsjahr absteigend gerankt sein, unabhängig von der Medienart. Cutoff nach x Jahren (tbd; Sonderfall Zsn für Cutoff?)

Ausnahme: Suche nach Jahr

duncdrum commented 10 months ago

Nur zur Klärung: Bei der Sortierung nach Relevanz sollen aktuellere Titel auch bei Zsn geboostet werden. Primäres sortierverhalten bleibt Relevanz also exaktere Treffer zu erst.

Die primär chornologische Sortierung der Liste läuft nicht über das Ranking.

[boost, sum(product(max(0,sum(product(abs(ms(NOW/YEAR,pub_date_max)),-5.285e-13),1)),6.5),1)]

wobei 6.5 hier unseren anderen 10er basierten boosts angeglichen werden muss

@annekauf hast du die Beispiel query wo man sieht dass es früher mal nicht so war oder wo es noch nicht klappt?

annekauf commented 10 months ago

Zsn nochmal spezieller wegen Ziel Gesamttitel vor Bänden, see #8

Bsp. für klappt noch nicht (Suche über "alle Felder"):

duncdrum commented 9 months ago

ok nach einigen tests: Datumsfunktionen erwarten im Index ein Datumsfeld. Wir haben jedoch ein Textfelder für publishDate und publishDateSort . Das limitiert was wir via ranking config gerade ziehen können.

see https://github.com/StaatsbibliothekBerlin/findex-config/blob/be9eec72a4f6086bd05a3e779a8a860024746da4/SolrCloud/solr_config/schema.xml#L230

annekauf commented 9 months ago

indeed... das war's dann mit chronologischem Ranking, dann geht nur Boost über letzte x Ersch.jahre.

annekauf commented 3 months ago

Lese gerade die Lit.Hinweise von Anne Christensen und finde hier (https://www.bib-bvb.de/documents/10967/9184676/Solr-Ranking+6-2018.pdf/3aaaa96c-8716-447a-8163-584f3ddf73f3)

diese Funktion für Chrono-Ranking: bf = recip(ms(NOW/YEAR,freshness),3.16e-11,1,1)^10.0

Could this work for us?

Also: Ermittlung der Freshness – Bei offenen Jahresangaben bei Zeitschriften aktuelles Jahr statt erstes verwenden ? – oder aktuellstes Jahr aus Bestandsangaben ? – „1000“ verwenden bei Titel ohne Jahr statt Aufnahmedatum ?

duncdrum commented 3 months ago

see #59 NOW/YEAR, returns dates but we are not dealing with dates