sbsdev / daisyproducer2

An integrated production management system for accessible media
GNU Affero General Public License v3.0
0 stars 0 forks source link

Different handling of '#' #121

Open egli opened 1 year ago

egli commented 1 year ago

Das Rautezeichen kann in Braille auf 2 Arten übersetzt werden:

  1. als Computerbraille (brl:computer) mit Ankündigung '$, d.h. '$# z.B. '$ANDERESEITE.HTM#UNTERKAPITEL2
  2. ohne Ankündigung in Kurzschrift mit Pt. 4 davor, d.h. "#TH+KGODF?THAT

Obwohl auch das zweite Beispiel klar dem Computerbereich (Hashtags, etc.) zuzuordnen ist, wird in der Punktschrift in diesem Fall i.d.R. die Variante ohne Computerbraille (ohne Auszeichnung brl:computer) gewählt (d.h. "#). Das Zeichen selbst (#) wird in diesem Fall zwar korrekt als "# wiedergegeben (siehe always-Regel in https://github.com/sbsdev/sbs-braille-tables/blob/master/tables/sbs-de-core.mod: always # 4-3456), doch die Übersetzung vom umgebenden Text (z.B. in #thankgodforthat) kann im Wörterbuch nicht mehr beeinflusst werden, da das Zeichen # aus dem String im Wörterbuch entfernt wird (da weder Buchstabe noch Zahl noch Apostroph).

Eventuelle Lösungen:

  1. (Saubere Variante) Das Zeichen # im Wörterbuch zulassen (ist ein seltenes Zeichen ausserhalb von Computerbraille; Computerbraille wird ohnehin via brl:computer ausgezeichnet). Vorteile: Übersetzung beeinflussbar, egal wo # vorkommt (am Anfang, im Wort, am Ende)

  2. (Workaround 1) Bei # ganzes Wort in brl:select setzen und "vorübersetzen" Vorteile: Übersetzung kann via brl:select gesteuert werden (Wort erscheint nicht im Wörterbuch) Nachteile: Aufwändiges Auszeichnen, wenn zahlreiche Ausdrücke mit # vorkommen

  3. (Workaround 2) # in brl:select als Entity definieren und restlichen Ausdruck ausserhalb des Selects lassen Vorteile: # können schnell mit Entity ersetzt werden, Übersetzung beeinflussbar im Wörterbuch Nachteile: Falsche Übersetzung bei gewissen wortinitialen Kürzungen, z.B. #exmann, #vereinigung (schlechte Lösung)

  4. (Workaround 3) Ausdruck nach # z.B. mit span- oder w-Element auszeichnen (nur full-Version des Schemas) Vorteile: schnelle Auszeichnung, Übersetzung beeinflussbar im Wörterbuch Nachteile: Falsche Übersetzung bei gewissen wortinitialen Kürzungen, z.B. #exmann, #vereinigung (schlechte Lösung)

Bsp. korrekter Übersetzung gem. BSKDL:

exmann "#E'XM+N

protest "#PRO(]

achtung "#<TU

ehre "#=RE

licht "#_T

egli commented 1 year ago

# would have to be treated like a part of a word