Closed albbas closed 9 years ago
Date: 2013-05-25 16:02:54 +0200
From: Lene Antonsen <
Davvisámi 1.0beta11-2013-05-25
Versjonen godtar ikke skuvlabusse, minibusse, girjebusse, ruvttobusse (alle er leksikaliserte), men den godtar girjebussedoaibma, ruvttobussefálaldat osv
Date: 2013-05-25 17:06:01 +0200
From: Lene Antonsen <
Versjonen godtar heller ikke:
ášši málle (men godtar mállet) 2005:s (bare s får rød strek) boasttuboalu tabealla (vil ha tabella) gutni
Date: 2013-05-25 17:08:51 +0200
From: Lene Antonsen <
gutni er feil, den skal ikke godkjennes
Date: 2013-05-25 21:41:54 +0200
From: Børre Gaup <
Kan det hende at det er denne buggen? http://giellatekno.uit.no/bugzilla/show_bug.cgi?id=1358
Date: 2013-05-25 21:42:45 +0200
From: Børre Gaup <
(In reply to comment #3)
Kan det hende at det er denne buggen? http://giellatekno.uit.no/bugzilla/show_bug.cgi?id=1358
Eller, i hvert fall ha noe å gjøre med den?
Date: 2013-05-25 22:15:04 +0200
From: Lene Antonsen <
Jo, det er nok som Trond også sier, at G3 substantiver mangler. Grunnen til at 'busse' godtas, er at det også er et verb. 'mállet' er også en verbform
Date: 2013-05-25 22:19:21 +0200
From: Lene Antonsen <
Også G7 mangler:
láđđit
Date: 2013-05-25 22:24:18 +0200
From: Trond Trosterud <
I tillegg til NRK:s får eg raud strek under i i NRK:i (nb: viss det kjem mellomrom etterpå, med punktum er det ok, som i NRK:i.
Date: 2013-05-30 14:28:40 +0200
From: Børre Gaup <
G3 og G7 er fikset.
Date: 2013-05-30 14:31:32 +0200
From: Børre Gaup <
(In reply to comment #7)
I tillegg til NRK:s får eg raud strek under i i NRK:i (nb: viss det kjem mellomrom etterpå, med punktum er det ok, som i NRK:i.
Jeg får samme resultat i LibreOffice på Linux, men når jeg kjører hunspell fra kommandolinja godtas NRK:i …
gt $ echo "NRK:i manan" | hunspell -d sme/hunspell/sme Hunspell 1.3.2
Så da er det OpenOffice/LibreOffice som spiller oss et puss. Får lete etter grunnen til det.
Date: 2013-05-30 14:42:25 +0200
From: Børre Gaup <
(In reply to comment #1)
Testet mot 1.0beta11-2013-05-30:
Versjonen godtar heller ikke:
ášši málle (men godtar mállet)
Kjennes igjen nå.
2005:s (bare s får rød strek)
Fremdeles feil.
boasttuboalu
gt $ echo boasttuboalu | usmeNorm 0%>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>100% boasttuboalu boasttu+N+Cmp#boallu+N+Sg+Acc boasttuboalu boasttu+N+Cmp#boallu+N+Sg+Gen
fst'en som lager stavekontrollordene sier dette: gt $ echo boasttuboalu | lookup -flags mbTT plxnonrec-analyser-sme.fst 0%>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>100% boasttuboalu boasttuboalu +?
Så den godkjenner ikke det ferdigsammensatte ordet. Men deler man ordet i to får vi dette resultat: gt $ echo "boasttu boalu" | preprocess | lookup -flags mbTT plxnonrec-analyser-sme.fst 0%>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>100% boasttu boasttu+N+CmpN/Pref+CmpN/SgN+RCmpnd
boalu boallu+N+SgGenCmp+RCmpnd boalu boallu+N+Sg+Acc boalu boallu+N+Sg+Gen
dvs. bunnanalysatoren vår kjenner igjen boasttu som venstredelen i et sammensatt ord, men blir tydeligvis filtrert bort senere i prosessen.
tabealla (vil ha tabella)
gjenkjennes
Date: 2013-06-13 13:03:27 +0200
From: Børre Gaup <
(In reply to comment #0)
Davvisámi 1.0beta11-2013-05-25
Versjonen godtar ikke skuvlabusse, minibusse, girjebusse, ruvttobusse (alle er leksikaliserte), men den godtar girjebussedoaibma, ruvttobussefálaldat osv
Fikset i 1.0beta11-2013-06-13
Date: 2013-06-13 13:05:51 +0200
From: Børre Gaup <
(In reply to comment #10)
(In reply to comment #1)
Testet mot 1.0beta11-2013-05-30:
Versjonen godtar heller ikke:
ášši málle (men godtar mállet)
Kjennes igjen nå.
2005:s (bare s får rød strek)
Fremdeles feil.
Ennå ikke fikset. 1.0beta11-2013-06-13
boasttuboalu
gt $ echo boasttuboalu | usmeNorm 0%>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>100% boasttuboalu boasttu+N+Cmp#boallu+N+Sg+Acc boasttuboalu boasttu+N+Cmp#boallu+N+Sg+Gen
fst'en som lager stavekontrollordene sier dette: gt $ echo boasttuboalu | lookup -flags mbTT plxnonrec-analyser-sme.fst 0%>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>100% boasttuboalu boasttuboalu +?
Så den godkjenner ikke det ferdigsammensatte ordet. Men deler man ordet i to får vi dette resultat: gt $ echo "boasttu boalu" | preprocess | lookup -flags mbTT plxnonrec-analyser-sme.fst 0%>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>100% boasttu boasttu+N+CmpN/Pref+CmpN/SgN+RCmpnd
boalu boallu+N+SgGenCmp+RCmpnd boalu boallu+N+Sg+Acc boalu boallu+N+Sg+Gen
dvs. bunnanalysatoren vår kjenner igjen boasttu som venstredelen i et sammensatt ord, men blir tydeligvis filtrert bort senere i prosessen.
Dette er nå fikset, det var en feil i omkodingen fra PLX-koder til hunspellkoder som sviktet. 1.0beta11-2013-06-13
tabealla (vil ha tabella)
gjenkjennes
Date: 2013-10-09 21:33:12 +0200
From: Børre Gaup <
Gikk igjennom alle valgene jeg fant i Tools->Options, og fant ingen som hjelper for NRK:i. 2005:s er noe som må fikses i hunspellkonverteringa.
Date: 2015-02-23 23:25:44 +0100
From: Sjur Nørstebø Moshagen <
Vidare rettingar i Hunspell-konverteringa må gjerast etter at Hunspell-konverteringa er på plass i ny infra. Det vil enno ta ei stund, men eg prøver å jobba med saka innimellom andre ting.
Date: 2015-07-10 00:37:00 +0200
From: Børre Gaup <
Vi er i ferd med å gå over til fst-baserte stavekontroller, lukker denne.
This issue was created automatically with bugzilla2github
Bugzilla Bug 1672
Date: 2013-05-25T16:02:54+02:00 From: Lene Antonsen <>
To: Børre Gaup <>
CC: sjur.n.moshagen, thomas.omma, trond.trosterud
Last updated: 2015-07-10T00:37:00+02:00