Open albbas opened 4 years ago
Date: 2020-06-15 15:44:37 +0200
From: Lene Antonsen <
Diskusjon om +Gram/tagger for derivasjon og transitivitet. Jeg skriver BZ, sjøl om sjur har oppfordret om å bruke Zulip, men jeg synes at det blir for uoversiktlig. Det er Inga som har tatt initiativet til denne saka.
Vi bruker +Gram/tagger i dag for tokenisering og ulikestavelses verrb (3syll): +Gram/TAbbr !!≈ ; @CODE@ : Transitive abbreviation (it needs an argument) +Gram/NoAbbr !!≈ ; @CODE@ : Intransitive abbreviations that are homonymous +Gram/TNumAbbr !!≈ ; @CODE@ : Transitive abbreviation if the following +Gram/NumNoAbbr !!≈ ; @CODE@ : Transitive abbreviations for which numerals +Gram/TIAbbr !!≈ ; @CODE@ : Both transitive and intransitive abbreviation +Gram/IAbbr !!≈ ; @CODE@ : Intransitive abbreviation (it takes no argument) +Gram/3syll !!≈ ; @CODE@ :trisyllabic verbs
Vi har tidligere diskutert om å endre fra +IV og +TV til +Gram/TV og Ǵram/IV for verb, så jeg tar dette opp samtidig. Dette er ikke implementert, men dette kunne høve å gjøre dette no?
Så er det å bruke +Gram/tagger i forbindelse med grammatisk informsjon for leksikaliserte ord: adverber har i dag +Comp og +Superl, Det er derivert fra adjektiver. Her kunne man endre +Comp og +Superl til +Gram/Comp og +Gram/Superl buoremusat buoremusat+Adv+Superl buoremusat buorre+Ex/A+Sem/Hum+Der/Superl+Ex/A+Der/AAdv+Adv
buorebut buorebut+Adv+Comp buorebut buorre+Ex/A+Sem/Hum+Der/Comp+Ex/A+Der/AAdv+Adv
Så er det andre ord som er leksikaliserte. Et type er substantiver som er blitt adjektiver via komparering:
maŋit maŋit+Ex/A+Sem/Plc+Der/Comp+A+Sg+Nom
Her er lemmaet allerede +Der/Comp, så dette er ikke en god analyse, En bedre ananlyse kunne være:
maŋit maŋit+A+Sem/Plc+Gramm/Comp+Sg+Nom
Inforamsjonen om Comp og Superl er nyttig i disambigueringa.
Man kunne også diskutere om man skulle tagge flere typer derivasjoner, f.eks. mánáš mánná+Ex/N+Sem/Hum+Der/Dimin+N+Sg+Nom mánáš mánáš+N+Sem/Hum+Sg+Nom ==> mánáš+N+Sem/Hum+Gram/Dimin+Sg+Nom
Men kanskje man skulle vente med slik til at man ser at det er nytte for dette i disambiguering eller gramcheck?
Date: 2020-06-15 22:21:52 +0200
From: Inga Lill Sigga Mikkelsen <
Jeg syns vi burde kjøre på med Gram/XXX tagger på flest mulig plasser. Ikke bare for avledninger, men for leksikaliserte PrsPrc også. Som oftes har vi jo allerede leksikon som er laget spesielt for en type leksikaliserte avledninger, så det er jo fort gjort å sette slike tagger inn.
Jeg har allerede endret taggene for substantiver som kan kompareres, slik at det blir slik i SMJ:
gáttep gáttep+A+Gram/Comp+Attr gáttep gáttep+A+Gram/Comp+Sg+Nom
Jeg startet med disse, fordi det var veldig merkelig med: gáttep+A+Der/Comp+A+Sg+Nom
Jeg vil gjerne fortsette med: oappásj oappásj+N+Sg+Nom dárbulasj dárbulasj+A+Sg+Nom fierun fierun+N+Sg+Nom (selv om vi ikke lager denne avledningen i vårt system) guollár guollár+N+Sg+Nom bårre bårre+A+Sg+Nom
Har vi ikke mulighet til å "mute" Gram/XXX tagger, hvis det skulle vise seg at de egentlig ikke blir brukt til noe?
Jeg syns det er tilfredstillende å ha system :)
This issue was created automatically with bugzilla2github
Bugzilla Bug 2665
Date: 2020-06-15T15:44:37+02:00 From: Lene Antonsen <>
To: Lene Antonsen <>
CC: inga.l.mikkelsen, lene.antonsen, linda.wiechetek, sjur.n.moshagen, thomas.omma, trond.trosterud
Last updated: 2020-06-15T22:21:52+02:00