raykyn / BeNASch

0 stars 0 forks source link

Weitere Entitäten bei Orten und Organisationen #1

Open raykyn opened 1 year ago

raykyn commented 1 year ago

"vor und hinder gelegen in der vorstat ze Eschemertor"

Die Frage bei diesen Fällen stellt, sich, was alles als Teil eines Eigennamens zu begreifen ist. Der erste Fall kan sowohl so annotiert werden:

"vor und hinder gelegen in [der vorstat [ze [Eschemertor]]]" In diesem Fall wären "vorstat" und "Eschemertor" verschiedene Entitäten, welche durch eine loc-Beziehung "ze Eschemertor" verbunden werden.

Alternativ liesse sich aber auch die ganze Konstruktion als NAM formulieren: "vor und hinder gelegen in [der vorstat ze Eschemertor]" Wobei der head alles ausser dem Artikel erfasst. Der Nachteil hierbei ist, dass das Eschemertor nicht als eigene Entität erfasst wird. In einem allfälligen Register würden nun das Tor (das ev. in anderen Dokumenten vorkommt) und die Vorstadt keine Beziehung mehr aufweisen. Aus diesen Gründen würde ich die erste Variante bevorzugen, sie entspricht dem Ziel der Vollständigkeit der Annotation.

raykyn commented 1 year ago

Besprechung 13.6.23:

Wir tendieren zu Variante 2, das heisst, die ganze Span als einen Eigennamen zu begreifen. Wir tun uns jedoch damit schwer, eine feste Grenze zu ziehen gegenüber Nominalnennungen mit Beschreibung.

Eine brauchbare Faustregel scheint fürs Erste zu sein, dass es sich dann um einen Eigennamen handelt, wenn die Entität einmal ist mit dieser Beschreibung. Zum Beispiel gibt es nur eine Vorstadt am Eschemertor, und es gibt auch nur ein Barfüsserkloster zu Basel. Daher sind die Beschreibungen "am Eschemertor" und "zu Basel" Teil des Eigennamens. Haben wir hingegen die Beschreibung "Die Mühle am St. Albanteich" ist diese, selbst wenn im Kontext des Dokuments klar ist, welche Mühle gemeint ist, als Nominalnennung zu annotieren, weil am St. Albanteich mehrere Mühlen stehen.

Die Diskussion ist sicher noch nicht beendet, aber bei Unsicherheit empfehlen wir die Annotation als Eigenname.

raykyn commented 1 year ago

image

image

Quelle: HGB 5, S. 28

Zwei weitere Beispiele zur Diskussion.

raykyn commented 1 year ago

Ich würde bei dieser Diskussion noch die Frage hinzufügen, wie weit wir die heads fassen, bzw. welchen Teil des Namens. Das könnte nämlich, wenn wir uns für die unverschachtelte Variante entscheiden, noch nützlich sein, um doch die Namen an sich stärker einzugrenzen.

Beispiel: "der Camerei s . Johans Bruderschaft uf Burg" => Head entweder "Camerei ... Burg" (syntaktisch korrekt) => oder "s. Johans Bruderschaft", sozusagen der "minimale" Eigenname, wobei "uf Burg" ev. auch dazugehört um es eindeutig zu machen.

raykyn commented 1 year ago

Besprechung 28.06.2023:

In diesem Beispiel wäre Kämmerei sowieso eine separate (hierarchisch untergeordnete) Entität zur Bruderschaft. Sie würde daher selbst als ORG getaggt werden. Damit erledigt sich das Problem.

Variante 2 hat sich als problemtisch erwiesen, weil es unter anderem stark von Kontextwissen abhängig ist, die Erwähnungen korrekt zu annotieren. Variante 1 wird auch wieder in Betracht gezogen, ist aber noch nicht endgültig beschlossen.

raykyn commented 1 year ago

Wir erkunden das Thema weiter in diesem google doc:

https://docs.google.com/document/d/1ri3nza_anwkBSIKCm30g3pUoipKlNx2s2SIKY0DFuiU/edit?usp=sharing

raykyn commented 1 year ago

Stand 07.09.2023:

Zur Frage der Unterscheidung von Eigennamen und nicht Eigennamen, insbesondere sichtbar am Beispiel des Klostes an den Steinen: Wird eine Formel, die auch eine Beziehung zu einer möglichen anderen Entität gängig als Eigenname verwendet (wie beim Kloster der Fall), ist diese Formel als Eigenname zu taggen, selbst wenn dadurch Informationen verloren gehen. Es ist schwierig hier eine klare Linie zu ziehen, und per Projekt sollte bei häufig auftretenden Nennungen beurteilt werden, ob eine Nennung als Eigenname einzustufen ist oder nicht.

Im Schema sollte zukünftig zu diesem Thema ein Kapitel stehen (unter "Schwierige Fälle") mit einigen Beispielen und der Logik hinter deren Annotation.

raykyn commented 7 months ago

Wir haben hier eigentlich kein abschliessendes Urteil gefällt, daher eröffne ich dieses issue noch einmal.

Nur damit wir hier wirklich eine klare Linie fassen.