Closed dwerning closed 2 years ago
Jetzt:
"char_filter": {
"transcription_brackets_filter": {
"type": "pattern_replace",
"pattern": "[\\(\\)\\[\\]⸢⸮?⸣]|\\{\\S*\\}",
"replacement": ""
},
"transcription_suffix_filter": {
"type": "mapping",
"mappings": [
",t,pl => ,wt",
",tpl => ,wt",
"t,du => ,tj",
",tdu => ,tj",
"du => wj",
"pl => w",
", => ."
]
}
},
Muss nauch Neuindizierung getestet werden.
Es scheint, ES splittet "sn.t" in "sn" und "t". Der Analoge Fall des ehemaligen Splittens bei "-" (e.g. "ḥm-nṯr") ist schon behoben ("ḥm-nṯr" wird gefunden). BTW: Die Maskierung von "." als "." in der RegEx-Suche ist schon implementiert (daran liegt es nicht).
Vgl. dazu: https://github.com/thesaurus-linguae-aegyptiae/tla-web/issues/89
Wohl das Problem: "\.[^- ]*" in ES lemma.json
Auch die mappings sind zu überprüfen ("pl => w" vor den anderen?).