Closed albbas closed 6 years ago
Date: 2016-01-07 15:07:00 +0100
From: Lene Antonsen <
Vi holder på å tilpasse sammensetning i smn til hvordan det er gjort i sme, for å gjøre MT enklest mulig. I den sammenheng har jeg en del spørsmål, evt forslag til endringer, avhengig av bakgrunnen er for det vi har idag. Alle eksemplene her er med deskriptiv analysator, som er den vi bruker for kildespråket i MT.
1) hvorfor bruker vi ikke Cmp/Hyph for sammensetninger med proper nouns?
+Cmp-# Per-Ole Per+N+Prop+Sem/Mal+Cmp/SgNom+Cmp-#Ole+N+Prop+Sem/Mal+Sg+Nom Piera-namma Piera+N+Prop+Sem/Mal+Cmp/SgNom+Cmp-#namma+N+Sg+Nom Oslo-olmmoš Oslo+N+Prop+Sem/Plc+Cmp/SgNom+Cmp-#olmmoš+N+Sg+Nom
+Cmp/Hyph+Cmp# skuvla-busse skuvla+N+Cmp/SgNom+Cmp/Hyph+Cmp#busse+N+G3+Sg+Nom
2) allegroform med bindestrek? Jeg tror largoform er minst like frekvent som allegro. Jeg foreslår å gi analyse til sammensetninger med largo-form, men hvilken tag ønsker divvun her? Kanskje man bør skille mellom allegro og largo?
beavdi-sátni beavdi-sátni +? beavde-sátni beavdi+N+Cmp/SgNom+Cmp/Hyph+Cmp#sátni+N+Sg+Nom
Date: 2016-01-07 15:15:29 +0100
From: Sjur Nørstebø Moshagen <
1)
Cmp/Hyph blir brukt for ord som har valfri bindestrek, og berre der. Samansetjingar med namn skal alltid ha bindestrek eller BÅDE liten fyrstebokstav OG ingen bindestrek. Den siste varianten har vi aldri hatt støtte for (med unnatak av det Lene har lagt til for sme i 2015). Dvs at for Prop er Hyph i praksis obligatorisk, og då er det ingen grunn til å tagga han.
2) høyrest ut som ein god ide.
Date: 2016-01-07 15:27:40 +0100
From: Thomas Omma <
2 yes i can do it
Date: 2016-01-07 16:20:04 +0100
From: Thomas Omma <
Modified: trunk/langs/sme/src/morphology/compounding.lexc Log: hyphen compuonding without flags for vowel reduction, bug2144
Modified: trunk/langs/sme/src/morphology/affixes/nouns.lexc Log: hyphened base form compounds to words that has unusual Nom compounding or normally lacks it
sme $ usme beavdi-sátni beavdi-sátni beavdi+N+Cmp/SgNom+Cmp/Hyph+Cmp#sátni+N+Sg+Nom
beavde-sátni beavde-sátni beavdi+N+Cmp/SgNom+Cmp/Hyph+Cmp#sátni+N+Sg+Nom beavde-sátni beavdi+N+Cmp/SgNom+Cmp/Hyph+Cmp#sátni+N+Sg+Nom
but the latter got two ánne-liissá
does it matter, and if: how solve?
Date: 2018-05-26 09:26:21 +0200
From: Lene Antonsen <
Nå er analysen slik, dvs at for formen med largo, har vi full morfologi og deretter +Cmp/Cit, og for formen med allegro, er det vanlig cmp-tagging, med bare +N. Jeg synes at dette er en god løsning.
beavdi-sátni beavdi-sátni beavdi+N+Sg+Nom+Cmp/Cit+Cmp/Hyph+Cmp#sátni+N+Sg+Nom
beavde-sátni beavde-sátni beavdi+N+Cmp/SgNom+Cmp/Hyph+Cmp#sátni+N+Sg+Nom
This issue was created automatically with bugzilla2github
Bugzilla Bug 2144
Date: 2016-01-07T15:07:00+01:00 From: Lene Antonsen <>
To: Thomas Omma <>
CC: lene.antonsen, linda.wiechetek, sandra.rahka, sjur.n.moshagen, trond.trosterud
See also: http://giellatekno.uit.no/bugzilla/show_bug.cgi?id=2419 Last updated: 2018-05-26T09:26:21+02:00