sbsdev / daisyproducer2

An integrated production management system for accessible media
GNU Affero General Public License v3.0
0 stars 0 forks source link

A correct in `sbs-de-g2-core.mod_src` causes words in the dictionary to be ignored #122

Open egli opened 1 year ago

egli commented 1 year ago

Zahlreiche corrects in sbs-de-g2-core.mod_src steuern, dass sowohl bei Gross- wie auch Kleinschreibung von Wörtern mit Apostroph (z.B. L'Alsace, l'Argentine, l'Albanie) korrekte Übersetzungsvorschläge im BD erscheinen (Vgl. dazu #1470).

#=#correct "'"["al"] "a\x250Al" 
#=#correct "'"["Al"] "A\x250Al" 
#=#correct "'"["aL"] "a\x250AL" 
#=#correct "'"["AL"] "A\x250AL" 
#=#correct "'"["an"] "a\x250An" 
#=#correct "'"["An"] "A\x250An" 
#=#correct "'"["aN"] "a\x250AN" 
#=#correct "'"["AN"] "A\x250AN" 
#=#correct "'"["ar"] "a\x250Ar" 
#=#correct "'"["Ar"] "A\x250Ar" 
#=#correct "'"["aR"] "a\x250AR" 
#=#correct "'"["AR"] "A\x250AR" 
#=#correct "'"["in"] "i\x250An" 
#=#correct "'"["In"] "I\x250An" 
#=#correct "'"["iN"] "i\x250AN" 
#=#correct "'"["IN"] "I\x250AN" 
#=#correct "'"["or"] "o\x250Ar" 
#=#correct "'"["Or"] "O\x250Ar" 
#=#correct "'"["oR"] "o\x250AR" 
#=#correct "'"["OR"] "O\x250AR" 

Dazu wird in den auf Apostroph folgenden obigen Kürzungen jeweils Dummytext (x250) eingefügt. Da der Dummytext aber nicht im lokalen WB abgelegt wird, werden die dort befindlichen Wörter bei der Übersetzung nicht gematcht, was bewirkt, dass Korrekturen im lokalen WB bei solchen Wörtern generell ignoriert werden.

Um dieses Problem zu vermeiden, müssten die corrects aus sbs-de-g2-core.mod_src entfernt werden und Einträge wie z.B.

#=#correct "'"["al"] "a\x250Al" 
#=#correct "'"["Al"] "A\x250Al" 
#=#correct "'"["aL"] "a\x250AL" 
#=#correct "'"["AL"] "A\x250AL" 

durch

always 'al 'AL

etc. ersetzt werden. Korrekturen des Übertragers im WB würden dann nicht mehr ignoriert werden, allerdings wären die Vorschläge bei diesen Wörtern z.T. (je nach Gross-/Kleinschreibung) fehlerhaft.

Problem: die always-Variante deckt nur die Kleinschreibung ab. Die Ersetzung aller corrects durch always, wie z.B.

always 'al 'AL
always 'Al 'AL
always 'aL 'AL
always 'AL 'AL

führt bei Grossschreibung nicht zu dem gewünschten Resultat und bewirkt immer dasselbe wie

always 'al 'AL
egli commented 1 year ago

Gross-/Kleinschreibung kann nach ' nicht korrigiert werden.

egli commented 1 year ago

Maybe we should lowercase everything in XSLT?