stazh / erqzh-data

Daten der Zürcher Rechtsquellen
0 stars 0 forks source link

Sprachen #2

Open ottosmops opened 3 years ago

ottosmops commented 3 years ago

Wenn die Suche nach Sprachen sinnvoll sein soll, müsste @xml:lang auf Dokumentebene korrekt ausgefüllt sein:

https://github.com/stazh/erqzh-data/blob/main/ZH_NF_I_2_1/SSRQ_ZH_NF_I_2_1_001_1.xml

Lateinische Quelle mit @xml:langauf "de"

Microtourist commented 3 years ago

Das meint bei uns die Sprache des ganzen Bandes; die Quellensprache des Stücks steht unter innerhalb von (halt auf deutsch).

ottosmops commented 3 years ago

Datentechnisch ist das nicht ganz sauber, weil es sich auf die Vorlage bezieht und nicht auf den edierten Text; aber ich gehe davon aus, dass ihr nicht verschiedensprachige Vorlagen habt und dann ist es natürlich i.O.

ottosmops commented 3 years ago

OK wir haben das nun versucht, die Inhalte von <textLang> sind aber zu uneinheitlich.

Zum Beispiel:

textLang xmlns="http://www.tei-c.org/ns/1.0">Deutsch</textLang>
<textLang xmlns="http://www.tei-c.org/ns/1.0">Deutsch, Latein</textLang>
<textLang xmlns="http://www.tei-c.org/ns/1.0">Latein</textLang>
<textLang xmlns="http://www.tei-c.org/ns/1.0">Latein; Deutsch</textLang>
<textLang xmlns="http://www.tei-c.org/ns/1.0">fr</textLang>

Deshalb mein Vorschlag nur ausgeschriebene Sprachen nehmen und <textLang> wiederholen, wenn mehr als eine Sprache vorkommt.

ottosmops commented 3 years ago

Um die zu ändernden Dateien zu finden:

//textLang[contains(., ';')]

Um die zu ändernden Dateien zu finden:

//textLang[contains(., ',')]
//textLang[contains(., 'fr')]
Microtourist commented 3 years ago

Danke; ich finde den Vorschlag gut und werde die Änderung vornehmen. Wenn ich die betroffenen Dateien anpasse, könnte ich aber natürlich auch gleich @xml:lang entsprechend anpassen (müsste aber von dir noch wissen, wie man dies bei den betroffenen mehrsprachigen Stücken macht).

ottosmops commented 3 years ago

Ich würde das @xml:lang für das ganze Dokument belassen, denn es ist ja eine deutschprachige Edition.

Microtourist commented 3 years ago

Ich habe die Anpassung nun gemacht: Bei mehreren Sprachen textLang verdoppelt und "fr" zu "Französisch" ausgeschrieben.