giellalt / bugzilla-dummy

0 stars 0 forks source link

Flertallsord: goelkegaamegh (Bugzilla Bug 1112) #1186

Closed albbas closed 13 years ago

albbas commented 13 years ago

This issue was created automatically with bugzilla2github

Bugzilla Bug 1112

Date: 2011-08-23T14:25:43+02:00 From: Sissel Jåma <> To: Ryan Johnson <> CC: ciprian.gerstenberger, heli1401, lene.antonsen, marit.fjellheim, ryan.txanson, sissel.jama, Sylvia.Sparrock, toini.bergstrom, trond.trosterud

Last updated: 2011-09-15T11:09:07+02:00

albbas commented 13 years ago

Comment 4885

Date: 2011-08-23 14:25:43 +0200 From: Sissel Jåma <>

'Goelkegaameh' og ikke 'goelkegaamegh' dukker opp i morfac. Det er kanskje gjort en spesiell merking da det brukes som flertallsord i oppgavene?

Eks:

Daate goelkegaameh lea duvres. Guktie doete? Daate aaj ___ goelkegaameh.

albbas commented 13 years ago

Comment 4898

Date: 2011-08-23 22:56:20 +0200 From: Ryan Johnson <>

Form.objects.filter(fullform='goelkegaameh')[0].tag.string 'N+Sg+Nom' Form.objects.filter(fullform='goelkegaamegh')[0].tag.string 'N+Pl+Nom'

Ser ut som det var i attrpos5?

<q id="attrpos5">
    <qtype>ATTRPOS</qtype>
    <qtype>A-MIX</qtype>
    <question>
        <text>Daate THING lea ADJ . Guktie doete</text>
        <element id="THING">
            <grammar tag="N+Sg+Nom"/>
            <sem class="CLOTHING"/>
        </element>
        <element id="ADJ">
            <grammar tag="A+Sg+Nom"/>
            <sem class="CLOTHES_A"/>
        </element>
    </question>
    <answer>
        <text>Daate aaj ADJ THING</text>
        <element game="morfa" id="ADJ" content="ADJ" task="yes">
            <grammar tag="A+Attr"/>
        </element>
    </answer>
</q>
albbas commented 13 years ago

Comment 4914

Date: 2011-08-26 14:01:36 +0200 From: Lene Antonsen <>

daate goelkegaameh er Sg Nom

Men denne skal ikke presenteres, da den er merka Use/NG:

LEXICON AAREGE +N+Sg+Nom+Use/NG:h%^DISIMP FINAL1 ;

Så jeg forstår ikke helt hvorfor den synes. Kanskje Ryan vet det?

albbas commented 13 years ago

Comment 4916

Date: 2011-08-26 21:27:45 +0200 From: Ryan Johnson <>

Aha, no skjønner eg. Gløymte å sjekka om det var andra N+Sg+Nom former til ordet. Det ser ut som Morfa-C gjer ikkje filtrering av NG-dialekt former. Det er noko som eg kan fiksa. :)

albbas commented 13 years ago

Comment 4917

Date: 2011-08-26 22:18:23 +0200 From: Ryan Johnson <>

Uff, det ser ut som det er framleis problemer på min del med dialektar, men her er eit godt spørsmål. Kanskje eg gløymer noko om korleis systemet fungerar, men det er slik eg ser det no:

Installeringsprosessen fungerar ved å ta n_paradigm.txt og ordi i n_smanob.xml, og konstruerar paradigmer:

goelkegaamege+N+Sg+Nom
goelkegaamege+N+Sg+Acc
goelkegaamege+N+Sg+Gen
goelkegaamege+N+Sg+Ill
goelkegaamege+N+Sg+Ine
goelkegaamege+N+Sg+Ela
goelkegaamege+N+Sg+Com
goelkegaamege+N+Pl+Nom
goelkegaamege+N+Pl+Acc
goelkegaamege+N+Pl+Gen
goelkegaamege+N+Pl+Ill
goelkegaamege+N+Pl+Ine
goelkegaamege+N+Pl+Ela
goelkegaamege+N+Pl+Com 

Desse vert køyrt gjenom alle FSTane: isma-norm.fst, isma-SH.fst, isma-L.fst... Med N+Sg+Nom ein får då:

isma-norm.fst: 

goelkegaamege+N+Sg+Nom
goelkegaamege+N+Sg+Nom  goelkegaameh
goelkegaamege+N+Sg+Nom  goelkegaamege

isma-SH.fst:

goelkegaamege+N+Sg+Nom
goelkegaamege+N+Sg+Nom  goelkegaamege

isma-L.fst:

goelkegaamege+N+Sg+Nom
goelkegaamege+N+Sg+Nom  goelkegaamege

Utkommet er då at ordet i databasen er organisert slik:

goelkegaamege: L, SH, norm
goelkegaameh: norm

Alle ord i databasen er markert med norm, men også ein eller annan av dei andre dialektane, og systemet viser deim fram ved SH eller L-markering (brukare velgjer L eller SH). Då kunne ein anta at eit ord i norm som ikkje hev SH eller L markering er NG ord, fordi det finst ikkje noko NG FST.

Eg kan forsikra at systemet fungerar slik: det gissar kva ord er NG fordi det er i isma-norm.fst, men ikkje i dei andre, eller: om det er mogleg å laga ein FST som genererar berre +Use/NG former, det går bra og.

Kva synest de?

albbas commented 13 years ago

Comment 4918

Date: 2011-08-27 21:29:06 +0200 From: Ryan Johnson <>

Eg gjort litt meir testing med problemet, og so fann fleire nye ting som eg hadde ikkje tenkt å gjera før. Skal gjeva ein liten oppdatering seinare når eg hev gått gjennom deim. :)

albbas commented 13 years ago

Comment 4919

Date: 2011-08-27 22:46:51 +0200 From: Ryan Johnson <>

Hev gjort nokre forandringar, og skal no å lada alle ord/spørsmål på nytt, so får me testa fleire andre bugger snart. :)

albbas commented 13 years ago

Comment 4920

Date: 2011-08-28 18:59:45 +0200 From: Ryan Johnson <>

Okei, det er ein fiks på plass. Kanskje bør restarta apache først. Eg testa på maskina mi ved å ta bort alle spørsmål bortsett frå den eine. Kunne sjå at det fungerar, men om folk kan ta litt oppmerksomheit til NG-former i grensesnittet det kan vera godt.

Typen forandring eg gjort var å gissa kva er +Use/NG fordi NG former kjem frå norm FST, men ikkje dei andre dialekt-FSTane. Det er ikkje so spesifisk som eg ville ha det, då høyrest det framleis godt ut å få ein NG FST som gjev berre former som skal godtast men skal ikkje visast fram i grensesnittet.

albbas commented 13 years ago

Comment 4929

Date: 2011-08-30 01:45:27 +0200 From: Ryan Johnson <>

Eg fann ein eksempel av dialekt filtrering i Morfa-C Adj:

Sagkan bïjle lea gamtege?
Jaavoe, daelie hov lea ________  bïjlem åasteme.

Her får ein gamtege (A+Sg+Nom, L og SH) til staden av gamte (A+Sg+Nom, NG).

albbas commented 13 years ago

Comment 5010

Date: 2011-09-05 15:23:10 +0200 From: Lene Antonsen <>

Jeg var ramla ut av cc-lista, derfor har jeg ikke kommentert.

goelkegaamege: L, SH, norm goelkegaameh: norm

Dette ser helt riktig ut. Ordformer som er merket med L eller SH, blir presentert. Ordformer merka med L, SH eller norm, godkjennes.