giellalt / lang-sme

Finite state and Constraint Grammar based analysers and proofing tools, and language resources for the Northern Sami language
https://giellalt.uit.no
GNU General Public License v3.0
6 stars 1 forks source link

Cmp/Hyph eller -# ( #251

Closed albbas closed 6 years ago

albbas commented 8 years ago

This issue was created automatically with bugzilla2github

Bugzilla Bug 2144

Date: 2016-01-07T15:07:00+01:00 From: Lene Antonsen <> To: Thomas Omma <> CC: lene.antonsen, linda.wiechetek, sandra.rahka, sjur.n.moshagen, trond.trosterud

See also: http://giellatekno.uit.no/bugzilla/show_bug.cgi?id=2419 Last updated: 2018-05-26T09:26:21+02:00

albbas commented 8 years ago

Comment 11046

Date: 2016-01-07 15:07:00 +0100 From: Lene Antonsen <>

Vi holder på å tilpasse sammensetning i smn til hvordan det er gjort i sme, for å gjøre MT enklest mulig. I den sammenheng har jeg en del spørsmål, evt forslag til endringer, avhengig av bakgrunnen er for det vi har idag. Alle eksemplene her er med deskriptiv analysator, som er den vi bruker for kildespråket i MT.

1) hvorfor bruker vi ikke Cmp/Hyph for sammensetninger med proper nouns?

+Cmp-# Per-Ole Per+N+Prop+Sem/Mal+Cmp/SgNom+Cmp-#Ole+N+Prop+Sem/Mal+Sg+Nom Piera-namma Piera+N+Prop+Sem/Mal+Cmp/SgNom+Cmp-#namma+N+Sg+Nom Oslo-olmmoš Oslo+N+Prop+Sem/Plc+Cmp/SgNom+Cmp-#olmmoš+N+Sg+Nom

+Cmp/Hyph+Cmp# skuvla-busse skuvla+N+Cmp/SgNom+Cmp/Hyph+Cmp#busse+N+G3+Sg+Nom

2) allegroform med bindestrek? Jeg tror largoform er minst like frekvent som allegro. Jeg foreslår å gi analyse til sammensetninger med largo-form, men hvilken tag ønsker divvun her? Kanskje man bør skille mellom allegro og largo?

beavdi-sátni beavdi-sátni +? beavde-sátni beavdi+N+Cmp/SgNom+Cmp/Hyph+Cmp#sátni+N+Sg+Nom

albbas commented 8 years ago

Comment 11047

Date: 2016-01-07 15:15:29 +0100 From: Sjur Nørstebø Moshagen <>

1)

Cmp/Hyph blir brukt for ord som har valfri bindestrek, og berre der. Samansetjingar med namn skal alltid ha bindestrek eller BÅDE liten fyrstebokstav OG ingen bindestrek. Den siste varianten har vi aldri hatt støtte for (med unnatak av det Lene har lagt til for sme i 2015). Dvs at for Prop er Hyph i praksis obligatorisk, og då er det ingen grunn til å tagga han.

2) høyrest ut som ein god ide.

albbas commented 8 years ago

Comment 11048

Date: 2016-01-07 15:27:40 +0100 From: Thomas Omma <>

2 yes i can do it

albbas commented 8 years ago

Comment 11049

Date: 2016-01-07 16:20:04 +0100 From: Thomas Omma <>

Modified: trunk/langs/sme/src/morphology/compounding.lexc Log: hyphen compuonding without flags for vowel reduction, bug2144

Modified: trunk/langs/sme/src/morphology/affixes/nouns.lexc Log: hyphened base form compounds to words that has unusual Nom compounding or normally lacks it

sme $ usme beavdi-sátni beavdi-sátni beavdi+N+Cmp/SgNom+Cmp/Hyph+Cmp#sátni+N+Sg+Nom

beavde-sátni beavde-sátni beavdi+N+Cmp/SgNom+Cmp/Hyph+Cmp#sátni+N+Sg+Nom beavde-sátni beavdi+N+Cmp/SgNom+Cmp/Hyph+Cmp#sátni+N+Sg+Nom

but the latter got two ánne-liissá

does it matter, and if: how solve?

albbas commented 6 years ago

Comment 12884

Date: 2018-05-26 09:26:21 +0200 From: Lene Antonsen <>

Nå er analysen slik, dvs at for formen med largo, har vi full morfologi og deretter +Cmp/Cit, og for formen med allegro, er det vanlig cmp-tagging, med bare +N. Jeg synes at dette er en god løsning.

beavdi-sátni beavdi-sátni beavdi+N+Sg+Nom+Cmp/Cit+Cmp/Hyph+Cmp#sátni+N+Sg+Nom

beavde-sátni beavde-sátni beavdi+N+Cmp/SgNom+Cmp/Hyph+Cmp#sátni+N+Sg+Nom