sbsdev / daisyproducer2

An integrated production management system for accessible media
GNU Affero General Public License v3.0
0 stars 0 forks source link

Partly emphasized words are ignored in the dictionary #123

Open egli opened 1 year ago

egli commented 1 year ago

Input:

 blaaaa<em>behauptungsgegenstand</em>

WB-Vorschlag (unbekannte Wörter):

 BLAAAAB=1PTUS,G,]

WB-Korrektur (Lokale Wörter) = SOLL:

 BLAAAA;HPUS,G,]

Output IST:

BLAAAA'_B=1PTUS,G,]
egli commented 1 year ago

Am einfachsten teilkursive Wörter nicht als ganze, sondern als Teilwörter mit Fortsetzungspunkten , d.h. "┊" im Dictionary erscheinen lassen und dann in DB abspeichern.

blaaaa┊ -> BLAAAA┊ (Vorschlag) -> BLAAXXXAA┊ (manipuliert) ┊behauptungsgegenstand -> ┊B=1PTUS,G,] (Vorschlag) -> ┊;HPUS,G,] (manipuliert)

Das Übersetungsresultat ist dann gemäss Dictionary und enthält die Markierung:

BLAAXXXAA'_;HPUS,G,]

Fürs Testen sämtliche Fälle berücksichtigen

 <em>bla</em>blo
 blo<em>bla</em>
 blo<em>bla</em>ble
 <em>blo</em>bla<em>blo</em>