deutschestextarchiv / dtabf

DTA Base Format (DTABf)
https://www.deutschestextarchiv.de/doku/basisformat/
Other
17 stars 9 forks source link

Schematron: Regeln, dass "Schriftart" und "Genre" vergeben sein müssen #4

Open cthomasdta opened 7 years ago

cthomasdta commented 7 years ago

Insbesondere Genre fehlt uns ja oft und ist im Nachhinein bzw. für Externe manchmal schwer zu vergeben.

textloop commented 6 years ago

Zur Schriftart:

Hier finde ich in der Basisformat-Doku als Vorgabe für den teiHeader der Textes:

  <physDesc>
    <typeDesc>
      <p>[vorherrschende Schriftart, z.B. 'Fraktur']</p>
    </typeDesc> 
  </physDesc>

[http://www.deutschestextarchiv.de/doku/basisformat/mdSdMsDesc.html]

Aber allgemein nur vorzugeben, dass //physDesc/typeDesc/p nicht leer sein darf, wäre etwas zu wenig, oder?

Vielleicht sollte man die Angabe der Schriftart weiter standardisieren. Die TEI-Guidelines schlagen ein typeNote-Element, vor, das eine ID trägt:

<typeDesc>
 <summary>Contains a mixture of blackletter and Roman (antiqua) typefaces</summary>
 <typeNote xml:id="Frak1">Blackletter face, showing
   similarities to those produced in Wuerzburg after 1470.</typeNote>
 <typeNote xml:id="Rom1">Roman face of Venetian origins.</typeNote>
</typeDesc>

[http://www.tei-c.org/release/doc/tei-p5-doc/en/html/examples-typeDesc.html]

Für das Basisformat sinnvoller wäre aber wohl, wenn die Definition der Schriftarten zentral in der ODD/Schema erfolgt und in den Dateien nur referenziert würde. In etwa in der Textdatei:

<typeDesc>
 <summary>Contains a mixture of blackletter and Roman (antiqua) typefaces</summary>
 <typeNote sameAs="#Frak1"/>
 <typeNote sameAs="#Rom1"/>
</typeDesc>

Was meint ihr? Übersehe ich etwas? Oder gibt es im Textkorpus schon teiHeader in denen das besser/anders gelöst ist?

textloop commented 6 years ago

Zum Genre: @cthomasdta Ich kann in der Basisformatdoku auf Anhieb keine eindeutige Info finden, wo das Genre vermerkt werden sollte. Hast du ein Beispiel dazu, wie es bereits bei euch gemacht wurde? Oder ist die Klassifikation nach http://www.deutschestextarchiv.de/doku/klassifikation gemeint?

susannehaaf commented 6 years ago

Doku zum Ort der Textsorte gibt's hier: http://www.deutschestextarchiv.de/doku/basisformat/mdProfileDesc.html

Die URL, die Du zitierst, @textloop, ist (leider) noch immer die aktuelle. Wir halten uns dabei an die "DWDS-Klassifikation". Eine überarbeitete Version der Textsortenklassifikation ist in Arbeit.

textloop commented 6 years ago

Ah, danke für die Aufklärung. Da hier http://www.deutschestextarchiv.de/doku/klassifikation#dwds ja dann bereits feste Werte definiert sind, wäre es aus meiner Sicht hier eine gute Idee, mittels Schematron sicherzustellen, dass auch eben nur diese Werte benutzt werden.

funkyfuture commented 6 years ago

zwei anmerkungen aus der perspektive, das dtabf zu nutzen, nicht aber, das dta zu betreiben: