Closed maschiegg closed 1 year ago
Implementiert via bc5c9a9. Das macht den Bauprozess um Vieles langsamer, weil die Erkennung von Leerzeichen vor jedem <lb/>
relativ teuer ist. Vermutlich ist es sinnvoll, einmal komplett in allen Quellen Leerzeichen vor und nach <lb/>
zu ersetzen, dann kann der „langsame“ Code auch wieder raus.
Die „berechneten“ -
werden etwas abgeblasst dargestellt.
Aufgabe für @nina-bro : "Vermutlich ist es sinnvoll, einmal komplett in allen Quellen Leerzeichen vor und nach
zu ersetzen, dann kann der „langsame“ Code auch wieder raus."
habe jetzt die Leerzeichen in den Quellen vor und nach lb in den Quellen entfernt
Super, danke. Damit verkürzt sich der Bauprozess auch signifikant.
Unsere TEI-Codierung der Silbentrennung ist etwas "ungewöhnlich". Das hier ist ein normaler Zeilenumbruch ohne Trennstrich:
Das hier ist eine Trennung mit Trennstrich:
--> in der HTML-Leseansicht sollte
als "-" erscheinen; sollte einmal eine Lemmatisierung erfolgen, dann sollte das Wort zusammengezogen werden zu "bezieht" (es können Leerzeichen vor und nach <...> sein)