raykyn / BeNASch

0 stars 0 forks source link

GPE neu einordnen? #28

Open raykyn opened 10 months ago

raykyn commented 10 months ago

Eine etwas grössere Veränderung, aber meiner Meinung nach eine, die mehr Konsistenz schaffen würde in der Ontologie. Im Moment gilt, dass eine geopolitische Entität samt einer Unterkategorie vermerkt wird, welche repräsentiert, welcher Aspekt der GPE in diesem Kontext relevant ist. Vergleichen wir das aber mit der Handhabung z.B. von kirchlichen Organisationen, zeigt sich eine Inkonsistenz. Bei einem Kloster z.B. ordnen wir es als ORG_REL ein, wenn sie als Organisation auftritt, aber als LOC_REL (oder LOC_FAC_REL) wenn es um das Gebäude an sich geht. Konsistenterweise müssten die Organisationen dann auch eher als REL_LOC oder ORG_LOC wie die GPEs vermerkt werden. Das macht aber aus offensichtlichen Gründen keinen Sinn.

Ich würde daher vorschlagen den etwas radikalen Schritt vorzunehmen und GPE als eine Top-Level-Kategorie abzuschaffen, und stattdessen LOC bzw. ORG unterzuordnen.

Diese Neueinordnung wird auch dadurch gestützt wenn wir die Top-Level-Einordnungen in erster Linie als Funktions-Einordnungen der Entitäten verstehen. Eine Stadt erfüllt als GPE_LOC/LOC_GPE dieselbe Funktion wie z.B. ein Markplatz (LOC/LOC_FAC), nicht aber wie eine andere Stadt, welche im ORG-Kontext auftritt. Die Art in welcher GPEs momentan gehandhabt bedeutet schlussendlich, dass wir 7 top-level Kategorien haben, PER, ORG, LOC, GPE_ORG, GPE_LOC, GPE_PER, GPE_GPE anstatt nur übersichtlicher 3.

Das einzige Problem, das ich sehe, ist die Einordnung von GPE-Erwähnungen, in denen nicht klar ist, ob sie sich auf den LOC oder ORG-Aspekt beziehen. Ein Problem, das aber ja eigentlich auch auf ORGs zutreffen kann. Man könnte in dem Fall z.B. festlegen dass im Zweifel die ORG Vorzug erhält.

GPE_PER (z.B. "die Berner") müsste zudem neu eingeordnet werden, entweder würden wir es auch als GPE_ORG verstehen, oder aber als NAM_LOC.PER.GRP (wobei wir im Moment keine Nennungsunterkategorisierungen bei Eigennamen verwenden, wobei dieser Fall ohnehin in seltenen Fällen auftreten könnte). Ich bin mit dieser Lösung im Moment noch nicht zufrieden.