thesaurus-linguae-aegyptiae / tla-es

Thesaurus Linguae Aegyptiae Spring backend for Elasticsearch access
1 stars 4 forks source link

Search logic: Regular Expression search does not work #20

Closed dwerning closed 2 years ago

simondschweitzer commented 3 years ago

Die Frage ist, ob denn das überhaupt gewünscht ist. Die RegEx-Zeichen beißen sich ja mit den Umschriftzeichen. So denkt ein Ägyptologe bei mrw.t nicht an den RegEx-Punkt. Insofern dürfte RegEx nicht als Default eingestellt sein, sondern es müsste einen zusätzlichen Knopf geben, RegEx einzuschalten. Oder es müsste RegEx mit anderen Zeichen implementiert werden, wie es Herr Seidlmayer beim alten TLA gemacht hat. Ferner müsste man sich anschauen, wie häufig RegEx benutzt wird. Ich kenne nur eine einzige TLA-User-Bubble, in der RegEx verwendet wird. Fast alle Nutzer verwenden es nicht. (Insofern muss man hier eine Kosten-Nutzen-Rechnung aufmachen.) Schließlich nutzen moderne Searchinterfaces eher eine fuzzy search als RegEx, sodass eine solche auch hier angedacht war; denn diese hat den Vorteil, dass die Nutzer da abgeholt werden, wo sie sich normalerweise bewegen: in Googlesuchen nutzen sie keine RegEx, sondern finden auch Treffer, wenn die Eingabe leicht abweicht. D.h. eine Fuzzysearch könnte bei einem mrwt unser mrw.t finden.

dwerning commented 3 years ago

Ja, die Möglichkeit einer Nicht-fuzzy-RegEx-Suche ist gewünscht; zum möglichen Gestaltung und offenen Konzeptionsfragen einer Fuzzy Search vgl. https://github.com/thesaurus-linguae-aegyptiae/tla-web/discussions/128

dwerning commented 3 years ago

hier noch die Hinweise zur RegEx-artigen Umsetzung im alten TLA: https://aaew.bbaw.de/tla/servlet/S04?f=h003 RegEx-Subset und Abwandlung:

Noch hinzuzufügen: