giellalt / bugzilla-dummy

0 stars 0 forks source link

Problemer med Hunspell Office 2013-05-25 (Bugzilla Bug 1672) #548

Closed albbas closed 9 years ago

albbas commented 11 years ago

This issue was created automatically with bugzilla2github

Bugzilla Bug 1672

Date: 2013-05-25T16:02:54+02:00 From: Lene Antonsen <> To: Børre Gaup <> CC: sjur.n.moshagen, thomas.omma, trond.trosterud

Last updated: 2015-07-10T00:37:00+02:00

albbas commented 11 years ago

Comment 8304

Date: 2013-05-25 16:02:54 +0200 From: Lene Antonsen <>

Davvisámi 1.0beta11-2013-05-25

Versjonen godtar ikke skuvlabusse, minibusse, girjebusse, ruvttobusse (alle er leksikaliserte), men den godtar girjebussedoaibma, ruvttobussefálaldat osv

albbas commented 11 years ago

Comment 8305

Date: 2013-05-25 17:06:01 +0200 From: Lene Antonsen <>

Versjonen godtar heller ikke:

ášši málle (men godtar mállet) 2005:s (bare s får rød strek) boasttuboalu tabealla (vil ha tabella) gutni

albbas commented 11 years ago

Comment 8306

Date: 2013-05-25 17:08:51 +0200 From: Lene Antonsen <>

gutni er feil, den skal ikke godkjennes

albbas commented 11 years ago

Comment 8307

Date: 2013-05-25 21:41:54 +0200 From: Børre Gaup <>

Kan det hende at det er denne buggen? http://giellatekno.uit.no/bugzilla/show_bug.cgi?id=1358

albbas commented 11 years ago

Comment 8308

Date: 2013-05-25 21:42:45 +0200 From: Børre Gaup <>

(In reply to comment #3)

Kan det hende at det er denne buggen? http://giellatekno.uit.no/bugzilla/show_bug.cgi?id=1358

Eller, i hvert fall ha noe å gjøre med den?

albbas commented 11 years ago

Comment 8309

Date: 2013-05-25 22:15:04 +0200 From: Lene Antonsen <>

Jo, det er nok som Trond også sier, at G3 substantiver mangler. Grunnen til at 'busse' godtas, er at det også er et verb. 'mállet' er også en verbform

albbas commented 11 years ago

Comment 8310

Date: 2013-05-25 22:19:21 +0200 From: Lene Antonsen <>

Også G7 mangler:

láđđit

albbas commented 11 years ago

Comment 8312

Date: 2013-05-25 22:24:18 +0200 From: Trond Trosterud <>

I tillegg til NRK:s får eg raud strek under i i NRK:i (nb: viss det kjem mellomrom etterpå, med punktum er det ok, som i NRK:i.

albbas commented 11 years ago

Comment 8317

Date: 2013-05-30 14:28:40 +0200 From: Børre Gaup <>

G3 og G7 er fikset.

albbas commented 11 years ago

Comment 8318

Date: 2013-05-30 14:31:32 +0200 From: Børre Gaup <>

(In reply to comment #7)

I tillegg til NRK:s får eg raud strek under i i NRK:i (nb: viss det kjem mellomrom etterpå, med punktum er det ok, som i NRK:i.

Jeg får samme resultat i LibreOffice på Linux, men når jeg kjører hunspell fra kommandolinja godtas NRK:i …

gt $ echo "NRK:i manan" | hunspell -d sme/hunspell/sme Hunspell 1.3.2

Så da er det OpenOffice/LibreOffice som spiller oss et puss. Får lete etter grunnen til det.

albbas commented 11 years ago

Comment 8319

Date: 2013-05-30 14:42:25 +0200 From: Børre Gaup <>

(In reply to comment #1)

Testet mot 1.0beta11-2013-05-30:

Versjonen godtar heller ikke:

ášši málle (men godtar mállet)

Kjennes igjen nå.

2005:s (bare s får rød strek)

Fremdeles feil.

boasttuboalu

gt $ echo boasttuboalu | usmeNorm 0%>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>100% boasttuboalu boasttu+N+Cmp#boallu+N+Sg+Acc boasttuboalu boasttu+N+Cmp#boallu+N+Sg+Gen

fst'en som lager stavekontrollordene sier dette: gt $ echo boasttuboalu | lookup -flags mbTT plxnonrec-analyser-sme.fst 0%>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>100% boasttuboalu boasttuboalu +?

Så den godkjenner ikke det ferdigsammensatte ordet. Men deler man ordet i to får vi dette resultat: gt $ echo "boasttu boalu" | preprocess | lookup -flags mbTT plxnonrec-analyser-sme.fst 0%>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>100% boasttu boasttu+N+CmpN/Pref+CmpN/SgN+RCmpnd

boalu boallu+N+SgGenCmp+RCmpnd boalu boallu+N+Sg+Acc boalu boallu+N+Sg+Gen

dvs. bunnanalysatoren vår kjenner igjen boasttu som venstredelen i et sammensatt ord, men blir tydeligvis filtrert bort senere i prosessen.

tabealla (vil ha tabella)

gjenkjennes

albbas commented 11 years ago

Comment 8366

Date: 2013-06-13 13:03:27 +0200 From: Børre Gaup <>

(In reply to comment #0)

Davvisámi 1.0beta11-2013-05-25

Versjonen godtar ikke skuvlabusse, minibusse, girjebusse, ruvttobusse (alle er leksikaliserte), men den godtar girjebussedoaibma, ruvttobussefálaldat osv

Fikset i 1.0beta11-2013-06-13

albbas commented 11 years ago

Comment 8367

Date: 2013-06-13 13:05:51 +0200 From: Børre Gaup <>

(In reply to comment #10)

(In reply to comment #1)

Testet mot 1.0beta11-2013-05-30:

Versjonen godtar heller ikke:

ášši málle (men godtar mállet)

Kjennes igjen nå.

2005:s (bare s får rød strek)

Fremdeles feil.

Ennå ikke fikset. 1.0beta11-2013-06-13

boasttuboalu

gt $ echo boasttuboalu | usmeNorm 0%>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>100% boasttuboalu boasttu+N+Cmp#boallu+N+Sg+Acc boasttuboalu boasttu+N+Cmp#boallu+N+Sg+Gen

fst'en som lager stavekontrollordene sier dette: gt $ echo boasttuboalu | lookup -flags mbTT plxnonrec-analyser-sme.fst 0%>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>100% boasttuboalu boasttuboalu +?

Så den godkjenner ikke det ferdigsammensatte ordet. Men deler man ordet i to får vi dette resultat: gt $ echo "boasttu boalu" | preprocess | lookup -flags mbTT plxnonrec-analyser-sme.fst 0%>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>100% boasttu boasttu+N+CmpN/Pref+CmpN/SgN+RCmpnd

boalu boallu+N+SgGenCmp+RCmpnd boalu boallu+N+Sg+Acc boalu boallu+N+Sg+Gen

dvs. bunnanalysatoren vår kjenner igjen boasttu som venstredelen i et sammensatt ord, men blir tydeligvis filtrert bort senere i prosessen.

Dette er nå fikset, det var en feil i omkodingen fra PLX-koder til hunspellkoder som sviktet. 1.0beta11-2013-06-13

tabealla (vil ha tabella)

gjenkjennes

albbas commented 11 years ago

Comment 8549

Date: 2013-10-09 21:33:12 +0200 From: Børre Gaup <>

Gikk igjennom alle valgene jeg fant i Tools->Options, og fant ingen som hjelper for NRK:i. 2005:s er noe som må fikses i hunspellkonverteringa.

albbas commented 9 years ago

Comment 10238

Date: 2015-02-23 23:25:44 +0100 From: Sjur Nørstebø Moshagen <>

Vidare rettingar i Hunspell-konverteringa må gjerast etter at Hunspell-konverteringa er på plass i ny infra. Det vil enno ta ei stund, men eg prøver å jobba med saka innimellom andre ting.

albbas commented 9 years ago

Comment 10571

Date: 2015-07-10 00:37:00 +0200 From: Børre Gaup <>

Vi er i ferd med å gå over til fst-baserte stavekontroller, lukker denne.