giellalt / bugzilla-dummy

0 stars 0 forks source link

Problematisk med en del ord med -ŋg- (Bugzilla Bug 2041) #302

Open albbas opened 9 years ago

albbas commented 9 years ago

This issue was created automatically with bugzilla2github

Bugzilla Bug 2041

Date: 2015-05-02T19:06:34+02:00 From: Lene Antonsen <> To: Sjur Nørstebø Moshagen <> CC: berit.a.baal, borre.gaup, lene.antonsen, thomas.omma, trond.trosterud

Last updated: 2017-03-02T16:01:07+01:00

albbas commented 9 years ago

Comment 10467

Date: 2015-05-02 19:06:34 +0200 From: Lene Antonsen <>

Det er problematisk med en del ord med -ŋg- Grunnen er nok at den den samiske rettskrivinga ikke er helt logisk, fordi en del ord som uttales med -ŋŋ- likevel skrives med -ŋg-.

Eksempel på problematiske ord: CD-siŋgel balkoŋga basseaŋga (men ordet kan også skrives basseaŋŋa) betoŋga

(eller kanskje uttalen i Kautokeinodialekta er slik???)

albbas commented 9 years ago

Comment 10604

Date: 2015-08-17 12:59:30 +0200 From: Sjur Nørstebø Moshagen <>

Skal ta det opp med Acapela.

albbas commented 9 years ago

Comment 10708

Date: 2015-09-21 10:32:07 +0200 From: Sjur Nørstebø Moshagen <>

No need to have Biret Ánne and Ritva on the CC list anymore.

albbas commented 9 years ago

Comment 10721

Date: 2015-09-21 10:45:34 +0200 From: Sjur Nørstebø Moshagen <>

Eg var for kjapp med å fjerna Biret Ánne frå CC-lista. Denne meldinga gjeld talesyntesen, så eg reknar med at det er ok å få e-post dersom det skjer noko i saka.

albbas commented 7 years ago

Comment 12057

Date: 2017-03-02 08:56:18 +0100 From: Sjur Nørstebø Moshagen <>

Denne er ikkje løyst med siste versjon frå Acapela. I og med at ortografien er inkonsisten bør slike ord inn i ei unnataksordliste. Det har tydelegvis ikkje skjedd i oppdateringa, så vi må høyra med Acapela om vi kan få det med ein annan gong. Det å leggja inn slike ord i ei unntaksordliste burde ikkje vera ein stor jobb.

Dersom de finn fleire ord med same feil så ville det vera bra å leggja dei inn her.

albbas commented 7 years ago

Comment 12064

Date: 2017-03-02 09:50:21 +0100 From: Lene Antonsen <>

En del av ordene er lagt inn under lemma med ŋŋ i nouns-leksikonet:

Jeg ser at vi har både ŋg og ŋ'g på høyresiden av kolon, dette burde Thomas se på,

egrep "ŋŋ.:.(ŋg|ŋ'g)" src/morphology/stems/nouns.lexc |cut -d '+' -f1 | sort -u
gir følgende liste:

asfáltabetoŋga balkoŋga balloŋga baloŋgabuvssat betoŋga betoŋgalohkki betoŋgaluodda betoŋgamillu diftoŋga diftoŋganjuolgan dálkeiskanballoŋga dálvesesoŋga ea-diftoŋga geassesesoŋga giđđasesoŋga guolástansesoŋga ie-diftoŋga kartoŋga kupoŋga maŋgeroaŋga monoftoŋga oa-diftoŋga saloŋgavovdna saloŋgavávdna sesoŋga sesoŋgaáigi sviŋga tampoŋga ua-diftoŋga uo-diftoŋga vuoktasaloŋga čakčasesoŋga šargoŋga čuoigansesoŋga šáŋger

I tillegg så er det nok noen ord som er oppført med -ŋg- i lemmaet, men her finner vi også ord som ikke har -ŋŋ- uttale, så denne lista må gjennomgås manuelt (og endres oppføring for de ordene som er aktuelle). Dette burde Thomas se på, derfor setter jeg Thomas som assignee

grep 'ŋg.*:' src/morphology/stems/nouns.lexc |cut -d '+' -f1 | sort -u |l

Kandidater er bl.a.: basseaŋga doŋgeribuvssat

albbas commented 7 years ago

Comment 12065

Date: 2017-03-02 09:54:04 +0100 From: Lene Antonsen <>

Jeg ser at et ord kom med på lista, men det hører ikke til i gjengen, men var resultat av en litt for lettvint UNIX-kommando stryk: maŋgeroaŋga (maŋŋeroaŋga)

albbas commented 7 years ago

Comment 12084

Date: 2017-03-02 12:57:15 +0100 From: Thomas Omma <>

sme $ svn ci -m "no more normalizing for ŋŋ vs ŋg, bug2041" src Sending src/morphology/stems/nouns.lexc Transmitting file data . Committed revision 149376.

albbas commented 7 years ago

Comment 12085

Date: 2017-03-02 13:18:39 +0100 From: Lene Antonsen <>

(In reply to Thomas Omma from comment #7)

sme $ svn ci -m "no more normalizing for ŋŋ vs ŋg, bug2041" src Sending src/morphology/stems/nouns.lexc Transmitting file data . Committed revision 149376.

fra innsjekkinga: +betoŋgalohkki+Sem/Obj:betoŋga#lohkki GOAHTI-I ; +betoŋgaluodda+Sem/Route:betoŋga#luodda GOAHTI-A ; +betoŋŋalohkki+Sem/Obj:betoŋŋa#lohkki GOAHTI-I ; +betoŋŋaluodda+Sem/Route:betoŋŋa#luodda GOAHTI-A ;

Jeg prøver å forstå dette: Begge er norm? ŋg og ŋŋ ? 1) selv om begge er norm, så er det en fordel at de er under samme lemma, så jeg er uenig i løsninga med å splitte i to lemmaer 2) Buggen gjelder lista over ord som skrives med ŋg men skal uttales som ŋŋ i Acapela. Ved å bruke det opprinnelige systemet med ŋŋ i lemma også for ord som kan skrives med ŋg (altså legge slike former til høyre for :), så vil man lett kunne greppe ut ordliste til Acapella egrep "ŋŋ.:.(ŋg|ŋ'g)" src/morphology/stems/nouns.lexc |cut -d '+' -f1 | sort -u | sed 's/ŋŋ/ŋŋ/'

3) Jeg tenkte det ville være lurt å se på ord som var oppført med ŋg som lemma (eks basseaŋga) også hører inn under kategorien som skal uttales med ŋŋ. Hvis det er så at norm også er basseaŋŋa, så burde slike ord legges inn på samme måte som vi hadde diftoŋŋa, med diftoŋga til høyre. Dessuten stusset jeg på at noen hadde ŋg og andre hadde ŋ'g til høyre for kolon.

Jeg reåpner buggen.

albbas commented 7 years ago

Comment 12086

Date: 2017-03-02 13:20:21 +0100 From: Lene Antonsen <>

egrep "ŋŋ.:.(ŋg|ŋ'g)" src/morphology/stems/nouns.lexc |cut -d '+' -f1 | sort -u | sed 's/ŋŋ/ŋŋ/'

den siste skulle være sed 's/ŋŋ/ŋg/' hensikten er å få ŋg i lista til Acapella

albbas commented 7 years ago

Comment 12088

Date: 2017-03-02 14:21:33 +0100 From: Thomas Omma <>

sme $ svn ci -m "Bug2041, normalized ŋŋ vs ng and added more variants" src Sending src/morphology/stems/nouns.lexc Transmitting file data . Committed revision 149388.

albbas commented 7 years ago

Comment 12089

Date: 2017-03-02 15:26:20 +0100 From: Lene Antonsen <>

Sender denne tilbake til sjur, buggen er enda ikke løst i forhold til Acapella

albbas commented 7 years ago

Comment 12092

Date: 2017-03-02 16:01:07 +0100 From: Sjur Nørstebø Moshagen <>

Det er prinsipielt fire typar ord:

1) dei som skal skrivast ŋŋ og få ŋŋ-uttale 2) dei som skal skrivast ŋŋ og få ŋg-uttale 3) dei som skal skrivast ŋg og få ng-uttale 4) dei som skal skrivast ŋg og få ŋŋ-uttale

1) er ok, systemet oppfører seg rett 2) går eg ut frå ikkje finst - dei er i så fall skrivefeil, og då er ŋŋ-lesinga ok (slik at folk høyrer feilen) 3) er ok - systemet oppfører seg rett 4) må ein rekna som ortografiske unnatak, og må listast opp (dvs vi må senda ei liste med slike ord til Acapela)

Problemet er altså å skilja mellom 3) og 4), og det finst ingen andre måtar å gjera det på enn ved å laga ei liste. For alle ord utanfor denne lista vil talesyntesten gje ŋg-uttale, som i dei fleste fall er ok (det er anten korrekt eller avslører ein skrivefeil).

Kandidatar til denne lista kan de leggja inn i denne bugzilla-meldinga, så skal eg senda ho til Acapela ved passande høve.