ybracke / transnormer

A lexical normalizer for historical spelling variants using a transformer architecture.
GNU General Public License v3.0
6 stars 1 forks source link

Additional gold training data #47

Open ybracke opened 1 year ago

ybracke commented 1 year ago

Siehe ~/data/Overview.ods or here

ybracke commented 1 year ago

Kloster Chronik Münster

ybracke commented 1 year ago

Simplicissimus

ybracke commented 1 year ago

DiBiLit/zeno

ybracke commented 1 year ago

Abitur-Klausuren (from 1917 onward)

ybracke commented 1 year ago

DTA Erweiterungskorpus (not really "gold")

ybracke commented 1 year ago

Wikisource

Selbstbeschreibung: "Typischerweise wird als Textgrundlage eine gedruckte Vorlage oder ein zuverlässiger E-Text gewählt, wobei die Auswahl der Textgrundlage besonders sorgfältig erfolgen sollte. Ziel der möglichst originalgetreuen, nicht durch fragwürdige Normalisierungen beeinträchtigten Textwiedergabe ist es, dass nicht nur Laien, sondern auch Wissenschaftler den Text verwenden können."

ybracke commented 1 year ago

Anselm

ybracke commented 1 year ago

Historische Korpora IDS

ybracke commented 1 year ago

Referenzkorpus Frühneuhochdeutsch

ybracke commented 1 year ago

Historisches Vorlesungskorpus

ybracke commented 1 year ago

Klosterfrauenkorpus

ybracke commented 1 year ago

"Entwicklung der satzinternen Großschreibung im Deutschen"

ybracke commented 1 year ago

Gesellschaftliche Wissensproduktion in der Aufklärung

ybracke commented 1 year ago

Further hints

ybracke commented 1 year ago

GerManC-GS