raykyn / BeNASch

0 stars 0 forks source link

GRP-Attribute, die sich auf mehrere Einzelpersonen beziehen #11

Closed raykyn closed 1 year ago

raykyn commented 1 year ago

Siehe Beispiel:

image

(el sin => el sun, eheliche Söhne) Quelle: HGB Exp 2, S. 73

Wie annotieren wir diese Passage? Es handelt sich bei den "Söhnen" um ein Attribut der beiden Personen, zumindest gemäss Satzbau. Ich sehe folgende Möglichkeiten:

A) Wir verstossen gegen den Satzbau und machen die "Söhne" zum übergeordneten Tag, welcher die beiden Einzelerwähnungen einschliesst. Eine unschöne Lösung, die uns vermutlich in einige zukünftige Inkonsistenzen verwickeln wird.

B) Wir annotieren sie, wie im Beispiel, unabhängig voneinander und setzen dann part-whole-Beziehungen. Das ist mir schon lieber, aber es ist weiterhin etwas inkonsistent im Vergleich mit der Erwähnung einer einzelnen Person + Attribut.

C) Die "Söhne" werden als Teil des letzteren Namens annotiert, und dann durch eine part-whole-Beziehung mit den beiden Namen verbunden.

D) Personenaufzählungen werden von nun an immer als NAM/NOM + GRP annotiert, die "Söhne"-Annotation kann dann als Attribut dieser Annotation existieren. Meiner Meinung nach die sauberste Lösung, führt aber zu einem nicht zu unterschätzenden Mehraufwand bei Dokumenten mit Personenaufzählungen, bei denen diese nicht mit anderen Erwähnungen verlinkt werden müssen. z.B. müsste die Formel "\<Ehemann> und \<Ehefrau>" von da an immer als GRP getaggt werden.

Welche dieser Optionen würdet ihr bevorzugen? Oder habt ihr weitere Ideen?

raykyn commented 1 year ago

image Quelle: HGB 2, S. 77

Ein weiteres Beispiel, diesmal mit einer Berufsbezeichnung, die sich vmtl. auf beide Personen bezieht. Auch die Annotation von Familienname fällt in dieselbe Frage und ich denke, wir müssen unseren früheren Beschluss zu diesem Thema nochmal überdenken.

raykyn commented 1 year ago

image Quelle: HGB 2, S. 100.

Ein weiteres analoges Beispiel. In diesem Fall zwei Berufsbezeichnungen, die sich aber beide auf die "erben" beziehen.

raykyn commented 1 year ago

image Quelle: HGB 5, S. 3

Und noch ein Beispiel.

DominicWeber commented 1 year ago

Nach kurzem Austausch mit @raykyn gibt es nun noch Vorschlag E. Der Grund dafür ist, dass Vorschlag D ein Problem mit dem Head hat. Wenn alles von "Heinrich" bis "sin" als GRP getagged wird, dann ist "Heinrich Schaler u. Thoman Schaler" der Head dieses Tags. Dieser enthält aber wiederum Entitäten, was eigentlich nicht zulässig ist.

Vorschlag E) Wir führen einen neuen Annotationstyp auf der selben Ebene wie Entitäten und Werte ein: Listen. Diese unterscheiden sich insofern von GRP, als sie nicht eine einzelne Erwähnung (z. B. "Mr. Heinrich Schaler des Zieglers el sin") sind, sondern mehrere Entitäten zusammenfassen (z. B. die beiden NAM.PERs "Heinrich Schaler" und "Thoman Schaler"). Dies ist eigentlich eine saubere Lösung, bringt aber auch Schwierigkeiten mit sich. Wie würde man z. B. "Heinrich u. Thoman Schaler" taggen? Schaler ist hier auch der Nachname Heinrichs, den wir aber nur mitnehmen können, wenn wir beschliessen hier den Nachnamen als Attribut zu einem Vornamen zu taggen, was nicht konsistent mit unserem üblichen Umgang mit Namen ist.

raykyn commented 1 year ago

Besprechung 22.06.2023: Element zur Aufzählung "LST" (Liste) wird eingeführt wie im Vorschlag E beschrieben.

raykyn commented 1 year ago

Besprechung 22.06.23: Noch spezifisch für Familiennamen: Wir überlassen die Interpretation der Nachnamen einer anderen Ebene. Die Namen werden nur mit dem getaggten, was direkt daran steht. Das LST-Element hilft, die Namen zu verbinden.