Closed albbas closed 10 years ago
Date: 2013-10-17 23:13:52 +0200
From: Lene Antonsen <
Denne bugen har Ryan og jeg diskutert, men skriver likevel bz på denne slik at vi kan følge den opp.
hid 1 og 2 blir ikke generert, f.eks. govledh. Lemmasøk fungerer i NDS, men ikke f.eks. 'gåvla'.
fstene i /opt/ fungerer slik de skal [lene@gtoahpa bin]$ lookup -flags mbTT -utf8 dict-sma.fst 0%>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>100% gåvla gåvla govledh+1+V+TV+Ind+Prs+Sg3
^C [lene@gtoahpa bin]$ lookup -flags mbTT -utf8 isma-dict.fst 0%>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>100% govledh+1+V+TV+Ind+Prs+Sg3 govledh+1+V+TV+Ind+Prs+Sg3 gåvla
I leksikonfilene brukes det hid="1" og hid="2"
I newinfra er denne endra til +Hom1 og +Hom2. Når vi kompilerer nye fst-er for dict i newinfra, må vi endre dette i leksikonet og Ryan i sine filer.
Date: 2013-10-18 19:39:23 +0200
From: Lene Antonsen <
Jeg har nå kompilert i newinfra og copiert følgende over i /opt/smi/sma/bin/
analyser-dict-gt-desc.xfst <==== denne for analyse analyser-dict-gt-norm.xfst
generator-dict-gt-norm.xfst <==== denne for generering
Jeg foreslår at vi bruker desc for analyse for å kunne kjenne igjen flere unormerte former. Jeg endrer nå taggene i leksikonfilene til +Hom1 og +Hom2
Date: 2013-10-18 19:44:52 +0200
From: Lene Antonsen <
Slik ser det ut:
$ lookup -flags mbTT -utf8 analyser-dict-gt-desc.xfst 0%>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>100% gåvla gåvla govledh+Hom1+V+TV+Ind+Prs+Sg3
^C $ lookup -flags mbTT -utf8 generator-dict-gt-norm.xfst 0%>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 100% govledh+Hom1+V+TV+Ind+Prs+Sg3 govledh+Hom1+V+TV+Ind+Prs+Sg3 gåvla
Date: 2013-12-09 02:34:56 +0100
From: Ryan Johnson <
(In reply to comment #2)
Slik ser det ut:
$ lookup -flags mbTT -utf8 analyser-dict-gt-desc.xfst 0%>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>100% gåvla gåvla govledh+Hom1+V+TV+Ind+Prs+Sg3
^C $ lookup -flags mbTT -utf8 generator-dict-gt-norm.xfst 0%>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 100% govledh+Hom1+V+TV+Ind+Prs+Sg3 govledh+Hom1+V+TV+Ind+Prs+Sg3 gåvla
Hei,
Kanksje på grunn av ei endring eg gjorde, får eg ikkje dette til å fungera, men når eg lagar ein override i src/Makefile.am som ser ut slik som den fylgjande, fungerar det... Eg fekk det ikkje til på noko anna vis. Eg kan halda fram med å implementera fiksen som gjer desse synlege i NDS, men løysing trengst framleis i korleis generatoren vert byggd.
#
generator-dict-gt-norm.tmp.xfst: analyser-raw-gt-desc.xfst \ filters/make-optional-transitivity-tags.xfst \ filters/make-optional-variant-tags.xfst \ filters/remove-derivation-position-tags.xfst \ filters/remove-dialect-tags.xfst \ filters/remove-hyphenation-marks.xfst \ filters/remove-infl_deriv-borders.xfst \ filters/remove-word-boundary.xfst \ filters/remove-norm-comp-tags.xfst \ filters/remove-number-string-tags.xfst \ filters/remove-usage-tags.xfst \ filters/remove-orthography-tags.xfst \ filters/remove-Orth_IPA-strings.xfst \ filters/remove-sub-forms.xfst $(AM_V_GEN)$(PRINTF) "read regex \ @\"filters/make-optional-transitivity-tags.xfst\" \ .o. @\"filters/make-optional-variant-tags.xfst\" \ .o. @\"filters/remove-derivation-position-tags.xfst\" \ .o. @\"filters/remove-dialect-tags.xfst\" \ .o. @\"filters/remove-norm-comp-tags.xfst\" \ .o. @\"filters/remove-number-string-tags.xfst\" \ .o. @\"filters/remove-usage-tags.xfst\" \ .o. @\"filters/remove-sub-forms.xfst\" \ .o. @\"filters/remove-orthography-tags.xfst\" \ .o. @\"filters/remove-Orth_IPA-strings.xfst\" \ .o. @\"$<\" \ .o. @\"filters/remove-hyphenation-marks.xfst\" \ .o. @\"filters/remove-infl_deriv-borders.xfst\" \ .o. @\"filters/remove-word-boundary.xfst\" \ ;\n\ invert net\n\ save stack $@\n\ quit\n" | $(XFST)
Date: 2013-12-09 03:05:25 +0100
From: Ryan Johnson <
Hei,
Det ser ut som koden fungerar allerede, i opt no ser eg gamle +1 og +2. Hev oppdatert ein del ting med byggjeprossess innan NDS. Når me får sma til å kompilera, so trur eg at det fungerar att. Viss dette med Makefile.am ser riktig ut, eg kan sjekke inn. Eg mest kopiert det som sto til oahpa-analyserar, som ser ut til å vera nesten i samme form som det som trengst til dict.
Date: 2013-12-13 00:40:10 +0100
From: Ryan Johnson <
Eg oppdaterar gtoahpa no med dei nyaste endringane til baakoeh. So får me snart hid. :)
Date: 2013-12-13 00:59:22 +0100
From: Ryan Johnson <
Hei,
Det ser ut som eg mista noko viktig: generasjon fungerar bra, men då er det vanskeleg med oppslag. Eg får ogso govledh+Hom1 og govledh+Hom2 til å generera, men ikkje svijredh+Hom1 og svijredh+Hom2. Skal testa litt meir og få det løyst no.
Date: 2013-12-13 08:08:20 +0100
From: Lene Antonsen <
Jeg synes det er en fornuftig arbeidsfordeling at vi (jeg) sørger for at fstene fungerer som de skal, og så lager du sti til fstene i /opt/.
Jeg har nå testa fstene i /opt/smi/sma/bin/ på gtoahpa-serveren. De blei kompilert 18. oktober. De gir følgende resultat:
[lene@gtoahpa ~]$ lookup -flags mbTT /opt/smi/sma/bin/analyser-dict-gt-desc.xfst 0%>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>100% gåvla gåvla govledh+Hom1+V+TV+Ind+Prs+Sg3
svæjra svæjra svijredh+V+IV+Ind+Prs+Sg3
svijrie svijrie svijredh+V+IV+Ind+Prs+Sg3
[lene@gtoahpa ~]$ lookup -flags mbTT /opt/smi/sma/bin/generator-dict-gt-norm.xfst 0%>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 100%
govledh+Hom1+V+TV+Ind+Prs+Sg3 govledh+Hom1+V+TV+Ind+Prs+Sg3 gåvla
svijredh+Hom1+V+Ind+Prs+Sg3 svijredh+Hom1+V+Ind+Prs+Sg3 svijredh+Hom1+V+Ind+Prs+Sg3 +?
svijredh+V+IV+Ind+Prs+Sg3 svijredh+V+IV+Ind+Prs+Sg3 svijredh+V+IV+Ind+Prs+Sg3 +?
Her ser vi at svijredh ikke er merka med Hom1 og Hom2 i kildefilen. Dessuten funket ikke genereringa. Noe har skjedd i den perioden fstene blei kompilert. Jeg skal legge til Hom-tagger og kompilere nye fster i løpet av dagen.
Date: 2013-12-13 14:38:06 +0100
From: Lene Antonsen <
Updated to revision 85191. stems$ svn ci -m "Fjerna Use/NG fra svijredh og la til Hom1 og Hom2, som var forsvunnet" verbs.lexc Sending verbs.lexc Transmitting file data . Committed revision 85192. Skal kompilere seinere.
Date: 2013-12-13 20:10:25 +0100
From: Ryan Johnson <
(In reply to comment #7)
Jeg synes det er en fornuftig arbeidsfordeling at vi (jeg) sørger for at fstene fungerer som de skal, og så lager du sti til fstene i /opt/.
Høyrest bra ut. Eg endra ein del i kompileringsprosess i NDS, slik at når ein på gtweb skal kompilera FST og ordboka (som trengst slik at utviklingsarbeid er lettare for Jaska og andre), får ein gjera det utan å forstyrre andre FSTar-- so skifta eg til dict-FSTar. Eg endrar stiar slik at me nyttar desse:
/opt/smi/sma/bin/analyser-dict-gt-desc.xfst /opt/smi/sma/bin/generator-dict-gt-norm.xfst
Eg kan ogso ta bort FST-kompilering som ein del av den automatiske prosessen til baakoeh og sánit (eller, det med fab
kommando), viss det betyr at me alle hev betre kontroll på det som eksisterar. Med ordbøker på gtweb då, eg vil heller at Jaska kan kompilera på eiga hånd.
Date: 2013-12-16 00:31:23 +0100
From: Lene Antonsen <
Jeg har gjort endringer i lexc slik at alle ord genereres bortsett fra baakoegietjie og biejjievælloe som muligens skal fjernes fra dict.
Jeg har koordinert Hom1 og Hom2 mellom lexc og dictfila (v_smanob). Jeg har kompilert nye fster som jeg har kopiert over i /opt/smi/sma/bin/: generator-dict-gt-norm.xfst analyser-dict-gt-desc.xfst
Og jeg har testa. Alt ser bra ut. Så nå burde ordbokgenereringa og analysen fungere.
Date: 2013-12-16 13:43:28 +0100
From: Lene Antonsen <
Hei, jeg glemte at det er en sak som ikke er løst enda, nemlig at noen former forsvinner pga Use/NG-tagg-filterering. Denne må jeg løse i samarbeid med Sjur.
Date: 2013-12-19 01:11:33 +0100
From: Lene Antonsen <
Endelig er alt løst, etter masse arbeid fra Trond (endring av filtre etc):
[lene@gtoahpa ~]$ lookup -flags mbTT /opt/smi/sma/bin/generator-dict-gt-norm.xfst 0%>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>100% kuvsje+N+Pl+Nom kuvsje+N+Pl+Nom kuvsjh kuvsje+N+Pl+Nom kuvsjeh
govledh+Hom1+V+Inf govledh+Hom1+V+Inf govledh
govledh+Hom2+V+Inf govledh+Hom2+V+Inf govledh
Så nå kan du fortsette med arbeidet her, Ryan :-)
Date: 2014-01-07 23:27:41 +0100
From: Ryan Johnson <
Hei!
Det såg ut som eg hadde feil sti i konfigurasjonsfile, men eg fiksa det og nå får me generert Hom1 og Hom2.
http://baakoeh.oahpa.no/detail/sma/nob/svijredh.html
Det ser ut som svijredh+Hom2 får ikkje kontekst, men det fikser eg straks. Du kan lukke buggen viss alt er i orden. :)
Date: 2014-01-12 21:01:06 +0100
From: Lene Antonsen <
Problemet er ikke helt løst enda. Jeg tester med 'govledh' som skal gi to oversettinger: høre Hom1 og høres Hom2
<e usage="dict">
<lg>
<l class="IV" hid="Hom1" p3p="gåvla" pos="V" stem="2syll" type="TV" umlaut="D">govledh</l>
</lg>
<stem class="bisyllabic" />
<mg>
<tg xml:lang="nob">
<t pos="V">høre</t>
<xg>
<x>Dïhte gåvla.</x>
<xt>Han hører.</xt>
</xg>
</tg>
</mg>
Jeg får bare presentert den første i NDS.
fsten ser ut til å være ok
[lene@gtoahpa ~]$ lookup /opt/smi/sma/bin/generator-dict-gt-norm.xfst 0%>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>100%
LEXICON LOOK-UP
govledh+Hom2+V+Inf govledh+Hom2+V+Inf govledh
govledh+Hom1+V+Inf govledh+Hom1+V+Inf govledh
Date: 2014-01-12 23:18:25 +0100
From: Ryan Johnson <
Eg fiksa eit par ting i paradigmefiler, valens var til stades, og det ikkje burde vera (noko eg gløymde å gjera etter eg var ferdig med testing på paradigmen), nå ser eg både ord, generert med kontekst:
http://baakoeh.oahpa.no/detail/sma/nob/govledh.html
R
This issue was created automatically with bugzilla2github
Bugzilla Bug 1730
Date: 2013-10-17T23:13:52+02:00 From: Lene Antonsen <>
To: Ryan Johnson <>
CC: berit.nystad.eskonsipo, ciprian.gerstenberger, lene.antonsen, maja.l.kappfjell, sjur.n.moshagen, trond.trosterud
Last updated: 2014-01-13T00:34:45+01:00