Open cthomasdta opened 7 years ago
*.norm.xml ist für Kollation usw. absolut klasse. Unbedingt beibehalten.
ABER: das Voyant-(Norm-)XML ist für andere Dinge besser. Hintergrund: Es gibt leider ein Problem mit dem aus den *.norm.xml (via https://raw.githubusercontent.com/haoess/dta-tools/master/stylesheets/dtabf.xsl) erzeugten HTML: Dieses enthält beispielsweise noch Text in <del>; dieser wird zwar entsprechend als gestrichen formatiert/dargestellt, von Tools wie Copyfind aber als normaler Text behandelt. Lösung: HTML erzeugen aus Voyant-(Norm-)XML (wofür ja all diese Dinge schon berücksichtigt und entfernt wurden). Vorgehen am Beispiel von http://www.deutschestextarchiv.de/book/download_normxml/parthey_msgermqu1711_1828:
<del>
parthey_msgermqu1711_1828_1.VOYANT-norm.xml
Das wäre dann perfekt für CopyFind et al. Diskutieren wir dann gerne später weiter!
*.norm.xml ist für Kollation usw. absolut klasse. Unbedingt beibehalten.
ABER: das Voyant-(Norm-)XML ist für andere Dinge besser. Hintergrund: Es gibt leider ein Problem mit dem aus den *.norm.xml (via https://raw.githubusercontent.com/haoess/dta-tools/master/stylesheets/dtabf.xsl) erzeugten HTML: Dieses enthält beispielsweise noch Text in
<del>
; dieser wird zwar entsprechend als gestrichen formatiert/dargestellt, von Tools wie Copyfind aber als normaler Text behandelt. Lösung: HTML erzeugen aus Voyant-(Norm-)XML (wofür ja all diese Dinge schon berücksichtigt und entfernt wurden). Vorgehen am Beispiel von http://www.deutschestextarchiv.de/book/download_normxml/parthey_msgermqu1711_1828:parthey_msgermqu1711_1828_1.VOYANT-norm.xml
(so oder ähnlich benennen, jedenfalls müssen diese XML-Dateien von dem jetzigen (ebenfalls wichtigen!) *.norm.xml unterscheidbar bleiben) usw.Das wäre dann perfekt für CopyFind et al. Diskutieren wir dann gerne später weiter!