giellalt / shared-smi

Shared Sámi lexical resources
GNU General Public License v3.0
2 stars 0 forks source link

Gram/tagger for derivasjon og transitivitet ( #13

Open albbas opened 4 years ago

albbas commented 4 years ago

This issue was created automatically with bugzilla2github

Bugzilla Bug 2665

Date: 2020-06-15T15:44:37+02:00 From: Lene Antonsen <> To: Lene Antonsen <> CC: inga.l.mikkelsen, lene.antonsen, linda.wiechetek, sjur.n.moshagen, thomas.omma, trond.trosterud

Last updated: 2020-06-15T22:21:52+02:00

albbas commented 4 years ago

Comment 13950

Date: 2020-06-15 15:44:37 +0200 From: Lene Antonsen <>

Diskusjon om +Gram/tagger for derivasjon og transitivitet. Jeg skriver BZ, sjøl om sjur har oppfordret om å bruke Zulip, men jeg synes at det blir for uoversiktlig. Det er Inga som har tatt initiativet til denne saka.

Vi bruker +Gram/tagger i dag for tokenisering og ulikestavelses verrb (3syll): +Gram/TAbbr !!≈ ; @CODE@ : Transitive abbreviation (it needs an argument) +Gram/NoAbbr !!≈ ; @CODE@ : Intransitive abbreviations that are homonymous +Gram/TNumAbbr !!≈ ; @CODE@ : Transitive abbreviation if the following +Gram/NumNoAbbr !!≈ ; @CODE@ : Transitive abbreviations for which numerals +Gram/TIAbbr !!≈ ; @CODE@ : Both transitive and intransitive abbreviation +Gram/IAbbr !!≈ ; @CODE@ : Intransitive abbreviation (it takes no argument) +Gram/3syll !!≈ ; @CODE@ :trisyllabic verbs

Vi har tidligere diskutert om å endre fra +IV og +TV til +Gram/TV og Ǵram/IV for verb, så jeg tar dette opp samtidig. Dette er ikke implementert, men dette kunne høve å gjøre dette no?

Så er det å bruke +Gram/tagger i forbindelse med grammatisk informsjon for leksikaliserte ord: adverber har i dag +Comp og +Superl, Det er derivert fra adjektiver. Her kunne man endre +Comp og +Superl til +Gram/Comp og +Gram/Superl buoremusat buoremusat+Adv+Superl buoremusat buorre+Ex/A+Sem/Hum+Der/Superl+Ex/A+Der/AAdv+Adv

buorebut buorebut+Adv+Comp buorebut buorre+Ex/A+Sem/Hum+Der/Comp+Ex/A+Der/AAdv+Adv

Så er det andre ord som er leksikaliserte. Et type er substantiver som er blitt adjektiver via komparering:

maŋit maŋit+Ex/A+Sem/Plc+Der/Comp+A+Sg+Nom

Her er lemmaet allerede +Der/Comp, så dette er ikke en god analyse, En bedre ananlyse kunne være:

maŋit maŋit+A+Sem/Plc+Gramm/Comp+Sg+Nom

Inforamsjonen om Comp og Superl er nyttig i disambigueringa.

Man kunne også diskutere om man skulle tagge flere typer derivasjoner, f.eks. mánáš mánná+Ex/N+Sem/Hum+Der/Dimin+N+Sg+Nom mánáš mánáš+N+Sem/Hum+Sg+Nom ==> mánáš+N+Sem/Hum+Gram/Dimin+Sg+Nom

Men kanskje man skulle vente med slik til at man ser at det er nytte for dette i disambiguering eller gramcheck?

albbas commented 4 years ago

Comment 13951

Date: 2020-06-15 22:21:52 +0200 From: Inga Lill Sigga Mikkelsen <>

Jeg syns vi burde kjøre på med Gram/XXX tagger på flest mulig plasser. Ikke bare for avledninger, men for leksikaliserte PrsPrc også. Som oftes har vi jo allerede leksikon som er laget spesielt for en type leksikaliserte avledninger, så det er jo fort gjort å sette slike tagger inn.

Jeg har allerede endret taggene for substantiver som kan kompareres, slik at det blir slik i SMJ:

gáttep gáttep+A+Gram/Comp+Attr gáttep gáttep+A+Gram/Comp+Sg+Nom

Jeg startet med disse, fordi det var veldig merkelig med: gáttep+A+Der/Comp+A+Sg+Nom

Jeg vil gjerne fortsette med: oappásj oappásj+N+Sg+Nom dárbulasj dárbulasj+A+Sg+Nom fierun fierun+N+Sg+Nom (selv om vi ikke lager denne avledningen i vårt system) guollár guollár+N+Sg+Nom bårre bårre+A+Sg+Nom

Har vi ikke mulighet til å "mute" Gram/XXX tagger, hvis det skulle vise seg at de egentlig ikke blir brukt til noe?

Jeg syns det er tilfredstillende å ha system :)