giellalt / bugzilla-dummy

0 stars 0 forks source link

Hvordan få inn N+Actor og N+G3 i variablene i MorfaC? (Bugzilla Bug 1331) #1121

Closed albbas closed 12 years ago

albbas commented 12 years ago

This issue was created automatically with bugzilla2github

Bugzilla Bug 1331

Date: 2012-04-26T14:23:13+02:00 From: Lene Antonsen <> To: Ryan Johnson <> CC: berit.a.baal, heli1401, lene.antonsen, ryan.txanson, trond.trosterud

Last updated: 2012-05-08T09:21:25+02:00

albbas commented 12 years ago

Comment 6085

Date: 2012-04-26 14:23:13 +0200 From: Lene Antonsen <>

Vi snakket litt om dette på møtet 11.4, men for at vi bedre kan følge dette opp, så skriver jeg en bugzilla på dette.

Substantivene har tre typer tagger N+Actor+Sg+Nom N+G3+Sg+Nom N+Sg+Nom

I MorfaC får vi bare med N+Sg og N+Pl. Dvs at alle medlemmer av semantiske sett som har N+Actor og N+G3 ikke kommer med. Hvordan skal vi løse dette?

Kan man innføre en variabel? N+VAR+Sg+Nom VAR = tom, Actor, G3 (VAR = VARIABLE)

albbas commented 12 years ago

Comment 6086

Date: 2012-04-26 19:25:41 +0200 From: Ryan Johnson <>

Hei! Ja, det går an å gjera det slik. Eg må berre sjekke om at det er mogleg å få inn noko som er null, men det vert ei kort endring. Ser på det no. :)

albbas commented 12 years ago

Comment 6088

Date: 2012-04-26 21:10:21 +0200 From: Ryan Johnson <>

Okei, det ser ut til å fungera no. Eg veit ikkje kva du vil kalla typen for, men no er den Nountype. Eg valde % som nullbokstav som er i tags.txt no:

Nountype

G3 Actor %

Då får ein skriva f.eks., N+Nountype+Sg+Nom, og resultatet vert: N+G3+Sg+Nom, N+Actor+Sg+Nom, N+Sg+Nom. :)

albbas commented 12 years ago

Comment 6096

Date: 2012-04-27 11:06:24 +0200 From: Lene Antonsen <>

Jeg har lagt inn Nountype i alle relevante tagstrenger question-filene.

Det kunne vært fint å teste med å reinstallere en av filene.

albbas commented 12 years ago

Comment 6104

Date: 2012-04-28 10:50:58 +0200 From: Lene Antonsen <>

MorfaC oppgavene fungerer nå, men jeg kan ikke se at substantiver med Actor og G3 dukker opp i oppgavene. Er det mulig å søke etter f.eks. oahpaheaddji i morfaC-oppgaver i databasen for å se om de blir med?

albbas commented 12 years ago

Comment 6110

Date: 2012-04-29 00:15:20 +0200 From: Ryan Johnson <>

Hei, ja, det er mogleg. Eg sjekka først med oahpaheaddji, men det ser ut som det ikkje er former som var generert til det, men ordet står i spørsmål og svar. Er denne ein ny bugg?

>>> asdf = Word.objects.filter(lemma='oahpaheaddji')[0].wordqelement_set.all().values_list('qelement__question__qid', 'qelement__question__question__qid', 'qelement__question__qatype')
>>> list(set(asdf))
[('gos_leat', None, 'question'), ('nill3pl', None, 'question'), ('', 'nloc5sg', 'answer'), ('', 'nloc7sg', 'answer'), ('nloc1sg', None, 'question'), ('prefl3locpl3', None, 'question'), ('vprf1', None, 'question'), ('nloc2sg', None, 'question'), ('prec1illpl3', None, 'question'), ('numattr0', None, 'question'), ('', 'ngen0pl', 'answer'), ('', 'ngen0sg', 'answer'), ('', 'nloc7pl', 'answer'), ('prec6accpl3', None, 'question'), ('gos_leat_prt', None, 'question'), ('', 'nill8pl', 'answer'), ('', 'nill4pl', 'answer'), ('vprs1sg', None, 'question'), ('', 'numattr8', 'answer'), ('numattr1', None, 'question'), ('nloc3pl', None, 'question'), ('prefl4gensg3', None, 'question'), ('', 'nloc0pl', 'answer'), ('', 'nloc0sg', 'answer'), ('', 'numattr13', 'answer'), ('', 'nloc5pl', 'answer'), ('ngen1sg', None, 'question'), ('vcond1pl', None, 'question'), ('maid_luomus', None, 'question'), ('', 'numattr4', 'answer'), ('numattr14', None, 'question'), ('', 'nill5pl', 'answer'), ('', 'nill5sg', 'answer'), ('gos_boahtit_prt', None, 'question'), ('vpot0pl', None, 'question'), ('nloc1pl', None, 'question'), ('vprt1sg', None, 'question'), ('', 'ness0pl', 'answer'), ('', 'nnompl0', 'answer'), ('', 'ness0sg', 'answer'), ('vprs1pl', None, 'question'), ('go_luomus', None, 'question'), ('numattr11', None, 'question'), ('prec2illpl3', None, 'question'), ('', 'nloc8sg', 'answer'), ('', 'ncom6sg', 'answer'), ('', 'ngen6sg', 'answer'), ('gos_boahtit_prs', None, 'question'), ('', 'ncom6pl', 'answer'), ('', 'nill1pl', 'answer'), ('gos_leat_prs', None, 'question'), ('', 'nill1sg', 'answer'), ('nloc4pl', None, 'question'), ('', 'nloc8pl', 'answer'), ('nloc2pl', None, 'question'), ('vpot0sg', None, 'question'), ('vprt1pl', None, 'question'), ('maid_aigut_prs', None, 'question'), ('ngen1pl', None, 'question'), ('numattr12', None, 'question'), ('vcond1sg', None, 'question'), ('nloc4sg', None, 'question'), ('', 'nacc4pl', 'answer'), ('', 'ncom9', 'answer'), ('', 'nacc4sg', 'answer'), ('gos_finai', None, 'question'), ('nill3sg', None, 'question'), ('', 'nill8sg', 'answer'), ('nloc3sg', None, 'question'), ('gallin_joavkun', None, 'question'), ('', 'nill4sg', 'answer')]

Og her med lohkki, berre for å testa:

>>> Word.objects.filter(lemma='lohkki', form__tag__string__contains='+Actor').distinct()[0].wordqelement_set.all().values_list('qelement__question__qid', 'qelement__question__question__qid', 'qelement__question__qatype')
[('', 'predsup0', 'answer'), ('', 'predsup1', 'answer'), ('', 'dervv4', 'answer'), ('interr_pron_prs', None, 'question'), ('interr_pron_prt', None, 'question')]

Denne er den kortaste visa eg kan finne på for å finne svar til spørsmålet ditt, då er det litt uryddig. Her ser me at 'lohkki' (+Actor) er eit mogleg ord i svar til predsup0, osv., og eit mogleg ord i spørsmål til interr_pron_prs, osv.

Om du vil, eg kan laga ein liten skript som er tilgjengeleg frå (python manage.py) som printer ut former, semtyper, og medlemskapet på ei klarare vis, då hadde det vore lettare å testa eitt ord.

albbas commented 12 years ago

Comment 6112

Date: 2012-04-29 00:56:03 +0200 From: Ryan Johnson <>

Eg bestemte meg at ein liten skript skulle vera til hjelpe. Då! Om du vil leite etter eit ord og sjå alle ulike former, semtype, dialekt og morfa-c-medlemskaper, kan du få den ved fylgjande kommento i /home/univ_oahpa/univ_oahpa/ mappe:

python manage.py print_word -w [word]

f.eks.:

$ python manage.py print_word -w ruoŧŧilaš id: 498 lemma: ruoŧŧilaš pos: N language: sme stem: 2syll diphthong: no gradation: final rime: žž semtypes: MORFAS, OTHERS, HUMAN sources: d2 Wordforms: 13 forms generated

    N+Ess           ruoŧŧilažžan            GG, KJ, main
    N+Pl+Acc                ruoŧŧilaččaid           GG, KJ, main
    N+Pl+Com                ruoŧŧilaččaiguin                GG, KJ, main
    N+Pl+Gen                ruoŧŧilaččaid           GG, KJ, main
    N+Pl+Ill                ruoŧŧilaččaide          GG, KJ, main
    N+Pl+Loc                ruoŧŧilaččain           GG, KJ, main
    N+Pl+Nom                ruoŧŧilaččat            GG, KJ, main
    N+Sg+Acc                ruoŧŧilačča             GG, KJ, main
    N+Sg+Com                ruoŧŧilaččain           GG, KJ, main
    N+Sg+Gen                ruoŧŧilačča             GG, KJ, main
    N+Sg+Ill                ruoŧŧilažžii            GG, KJ, main
    N+Sg+Loc                ruoŧŧilaččas            GG, KJ, main
    N+Sg+Nom                ruoŧŧilaš               GG, KJ, main

Question membership: answer - predsup1 answer - predsup0 answer - dervv4

Om det er fleire ord som matcher lemma, då er alle prenta ut.

albbas commented 12 years ago

Comment 6156

Date: 2012-05-03 05:51:35 +0200 From: Ryan Johnson <>

Okei!

Eg trur eg hev ein fiks no. Problemet var ikkje so lett som eg trudde det var då eg fiksa den siste gongen, og det var det: eg hugsar at G3-skilnad funka ein gong, men då oppretta me Nountype tagklassa, og det var det som øydelagde installeringa. Kanskje høyrest litt rart ut, men problemet var at installeringsprosessen såg på Subclass-tagklassa (i tags.txt), men fordi me oppretta ei ny klassa som også hadde G3 og andre, var det feil. One-to-one relationship, ikkje one-to-many. So hev eg endra ling.py og words_install.py slik at den funkar med one-to-many. Eg vil no testa heile installeringsprosessen på maskina mi for å vera sikker om at endringa hev ikkje påvirkning på andre delar av prosessen, og so sjekker eg inn endringane mine. :)

albbas commented 12 years ago

Comment 6157

Date: 2012-05-03 06:19:20 +0200 From: Ryan Johnson <>

Eller kommentaren her burde gå til den andre G3 buggen. Men då ser det ut som den hev også fiksa problemet der oahpaheaddji ikkje fekk former i databasen sjølv om dei var genererte. Trur eg då installerer heile databasen i morgon, då ville det vera mykje å testa i Morfa-C :)

albbas commented 12 years ago

Comment 6168

Date: 2012-05-04 05:33:04 +0200 From: Ryan Johnson <>

Hei, det ser ut som det er no fiksa, men Morfa-C Adj for ganske ofte den gule sida, og problemet ser ut til å vera tagger med G3. Eg skal sjå på det, men i morgon tidleg.

albbas commented 12 years ago

Comment 6178

Date: 2012-05-04 17:51:43 +0200 From: Ryan Johnson <>

Okei, problemet er fiksa. Installeringa til spørsmål køyrer slik at den finn tags og semtypes og wordids, og lagrer deim i databasen. Med Nountype klassa fann eg at eg måtte endra på installeringa slik at ein tag ikkje er lagra om det var 0 ord med tag+semtype, men eg hadde ikkje gjort det same med wordid. No er dette fiksa. Eg installerte adjective_questions på nytt, men trur eg skal installlera dei andre spørsmålfilene på nytt no, det kan vera nokre spørsmål kjem ikkje fram p.g.a. + N+G3, eller noko slik. :)

albbas commented 12 years ago

Comment 6223

Date: 2012-05-08 09:21:25 +0200 From: Lene Antonsen <>

Dette fungerer nå, jeg lukker buggen.