giellalt / lang-sme

Finite state and Constraint Grammar based analysers and proofing tools, and language resources for the Northern Sami language
https://giellalt.uit.no
GNU General Public License v3.0
6 stars 1 forks source link

sammensetning av enstavelses navn fungerer ikke likt ( #297

Open albbas opened 8 years ago

albbas commented 8 years ago

This issue was created automatically with bugzilla2github

Bugzilla Bug 2213

Date: 2016-09-07T14:02:29+02:00 From: Lene Antonsen <> To: Sjur Nørstebø Moshagen <> CC: lene.antonsen, linda.wiechetek, maja.l.kappfjell, sandra.rahka, sjur.n.moshagen, thomas.omma, trond.trosterud

Last updated: 2016-09-19T07:37:26+02:00

albbas commented 8 years ago

Comment 11434

Date: 2016-09-07 14:02:29 +0200 From: Lene Antonsen <>

i fila: smi-propernouns.lexc er navn med tre bokstaver merka på to måter for å unngå sammensetninger, både med leksikon og med tagg:

LEXICON ProperNoun-smi-nocomp Ann+CmpNP/None+OLang/UND:Ann9 BERN-fem ;

Denne begrensninga fungerer for øyeblikket bare for sma. Dvs at det likevel går sti med flagg til ProperNoun-smi-nocomp-leksikonet.

Det også tagg for å begrense dette? +CmpNP/None? Eller er den beregna for sammensetninger uten hyph? Bare for HFST?

Hvis jeg forstår dette riktig, så er det bare sma som fungerer slik den skal?

apertium-sme-sma$ husmeNorm Ann-Lene Ann-Lene Ann+N+Prop+Sem/Fem+Cmp/SgNom+Cmp-#Lene+N+Prop+Sem/Fem+Attr 10,000000 Ann-Lene Ann+N+Prop+Sem/Fem+Cmp/SgNom+Cmp-#Lene+N+Prop+Sem/Fem+Sg+Acc 10,000000 Ann-Lene Ann+N+Prop+Sem/Fem+Cmp/SgNom+Cmp-#Lene+N+Prop+Sem/Fem+Sg+Gen 10,000000 Ann-Lene Ann+N+Prop+Sem/Fem+Cmp/SgNom+Cmp-#Lene+N+Prop+Sem/Fem+Sg+Nom 10,000000

husmjNorm Ann-Lene Ann-Lene Ann+N+Prop+Sem/Fem+Cmp/SgNom+Cmp-#Lene+N+Prop+Sem/Fem+Attr 0,000000 Ann-Lene Ann+N+Prop+Sem/Fem+Cmp/SgNom+Cmp-#Lene+N+Prop+Sem/Fem+Attr 0,000000 Ann-Lene Ann+N+Prop+Sem/Fem+Cmp/SgNom+Cmp-#Lene+N+Prop+Sem/Fem+Pl+Nom 0,000000 Ann-Lene Ann+N+Prop+Sem/Fem+Cmp/SgNom+Cmp-#Lene+N+Prop+Sem/Fem+Sg+Gen 0,000000 Ann-Lene Ann+N+Prop+Sem/Fem+Cmp/SgNom+Cmp-#Lene+N+Prop+Sem/Fem+Sg+Nom 0,000000

husmaNorm Ann-Lene Ann-Lene Ann-Lene+? inf

albbas commented 8 years ago

Comment 11435

Date: 2016-09-07 14:10:47 +0200 From: Lene Antonsen <>

Denne begrensninga var kanskje ikke ment for med Hyph, men bare uten? Kanskje er det sma som begrenser for mye?

sme$ husme Annviessu Annviessu Annviessu+? inf

Leneviessu Leneviessu Lene+N+Prop+Sem/Fem+Cmp/SgNom+Cmp#viessu+N+Sg+Nom 10,000000

^C

albbas commented 7 years ago

Comment 11437

Date: 2016-09-08 08:49:07 +0200 From: Sjur Nørstebø Moshagen <>

Det er rett at det er to system, og det er ikkje bra. Grunnen til at det har laga seg to system er at det taggbaserte systemet berre har vore brukt i stavekontrollane, og når det då har dukka opp liknande behov for norm-fst-ane har vi laga eit alternativt, leksikonbasert system. Det som er verre, er at desse to systema ikkje oppfører seg (heilt) likt.

Vi må sjå over heile prosessen med å kontrollera samansetjingar både for norm-fst-ar, desc-fst-ar og andre fst-ar, som t.d. stavekontrollar og grammatikkontrollanalysatorar.

albbas commented 7 years ago

Comment 11442

Date: 2016-09-19 07:37:26 +0200 From: Lene Antonsen <>

Pga MT-evalueringa gjør jeg noen endringer, for å få dette til å fungere i sma.

Logmelding 13.2.2015: Added the same compounding restrictions to SMA as to SME, SMJ and SMN. Short propers are now blocked completely from compounding, will change later to allow hyphens.

Det ser ut til at det er dette som problemet.

Stiene til propernouns er veldig annerledes i root-fila for sma enn sme og smj, og det er til og med doble stier. Jeg kommenterer ut og endrer slik at det blir likt med sme og sma.

Jeg endrer sma slik at den blir lik sme og smj.

husma Ann-Lene Ann-Lene Ann+N+Prop+Sem/Fem+Cmp/SgGen+Cmp-#Lene+N+Prop+Sem/Fem+Attr 10,000000 Ann-Lene Ann+N+Prop+Sem/Fem+Cmp/SgGen+Cmp-#Lene+N+Prop+Sem/Fem+Sg+Nom 10,000000 Ann-Lene Ann+N+Prop+Sem/Fem+Cmp/SgNom+Cmp-#Lene+N+Prop+Sem/Fem+Attr 10,000000 Ann-Lene Ann+N+Prop+Sem/Fem+Cmp/SgNom+Cmp-#Lene+N+Prop+Sem/Fem+Sg+Nom 10,000000