Closed albbas closed 10 years ago
Date: 2013-09-11 11:16:37 +0200
From: Lene Antonsen <
Det må inn endringer av pipe-line for sme (cgi)
pipeline for setningsanalyse skal endres slik pga av modulering av CG-analysen:
vislcg3 -g sme/src/sme-dis.rle | vislcg3 -g sme/src/smi-syn.rle
(etterhvert skal smi-syn.rle flyttes over i smi/src - men den er ikke testa og tilpassa for andre språk enda., Vi kan evt flytte den over allerede nå, hvis det er en fordel for pipeline)
Den andre endringen er delvis gjort allerede:
my $fst_without_semtags = "$fstdir/$lang-site.fst";
til bruk i analysen før paradigmegenereringa. Jeg ønsker at sme-site.fst også skal brukes i analysen av enkeltord, for å holde gjøre analysen mer forståelig for brukerne. Men i pipeline for setningsanalyse, må vi bruke sme.fst.
Kompileringa av sme-site.fst gjøres no manuelt og kopieres til /opt/, men dette bør inn i Makefile. Jeg skriver en egen bz på dette
Date: 2013-09-11 11:35:11 +0200
From: Lene Antonsen <
Kompileringa av sme-site.fst gjøres no manuelt og kopieres til /opt/, men dette bør inn i Makefile. Jeg skriver en egen bz på dette
Dette var ikke helt korrekt. Det blir kompilert en sme-site.fst, men den fungerer ikke helt som tenkt:
$LOOKUP $GTHOME/gt/sme/bin/sme-site.fst áhkku áhkku+Sem/Hum+N+Sg+Nom
Men dette hører til en annen bz
Date: 2013-09-13 08:55:10 +0200
From: Lene Antonsen <
(> Jeg ønsker at sme-site.fst også skal brukes i analysen av enkeltord, for å
holde gjøre analysen mer forståelig for brukerne. Dette er fiksa.
Date: 2013-09-17 13:15:38 +0200
From: Lene Antonsen <
(In reply to comment #0)
Det må inn endringer av pipe-line for sme (cgi)
pipeline for setningsanalyse skal endres slik pga av modulering av CG-analysen:
vislcg3 -g sme/src/sme-dis.rle | vislcg3 -g sme/src/smi-syn.rle
Jeg så i conf.pl, men jeg tror det er bedre at dette gjøres av Ciprian som kan dette. Det er flere ting som må tas hensyn til:
i conf.pl brukes nå $dis_bin og $dep_bin (med binære filer - det bør endres til $dis_rle og $dep_rle. Den siste er ikke definert.
For sme: hverken syn og dep har ikke 'lang' som fornavn, men 'smi',
forsløpig er det bare sme som bruke den modulære pipelinen og dermed må det lages egne definisjoner (elsif) for denne.
Date: 2013-09-17 13:42:45 +0200
From: Trond Trosterud <
Bug #1714 has been marked as a duplicate of this bug.
Date: 2013-09-17 13:44:10 +0200
From: Trond Trosterud <
Fiksa.
Merk at eg ikkje har retta opp i tekst vs. binær.
Date: 2013-10-02 08:04:13 +0200
From: Trond Trosterud <
Fiksa, men ikkje lukka. Eg lukkar no.
Date: 2014-01-22 00:56:10 +0100
From: Lene Antonsen <
Pipeline må oppdateres, har gjort et forsøk i conf.pl
For sme/smj/sma skal grammatikken være (vislcg3 -g …….)
for disambiguering: langs/smX/src/syntax/disambiguation.cg3
for syntaktisk analyse: gtcore/gtdshared/smi/src/syntax/functions.cg3
for dependens: gtcore/gtdshared/smi/src/syntax/dependency.cg3
Date: 2014-01-22 00:58:37 +0100
From: Lene Antonsen <
Glemte at alle analysatorene ligger i /opt/smi/smX/bin
=> bare filnavnet skal endres for disambiguering: disambiguation.cg3 for syntaktisk analyse: functions.cg3
for dependens: dependency.cg3
Jeg foreslår at vi ikke bruker binære filer, men cg3 istedenfor.
Date: 2014-04-10 08:50:21 +0200
From: Trond Trosterud <
Vi bruker no .cg3-filer i conf.pl. Eg lukkar buggen.
Date: 2014-04-10 08:50:54 +0200
From: Trond Trosterud <
Å seie det, ja, men å gjere det...
This issue was created automatically with bugzilla2github
Bugzilla Bug 1712
Date: 2013-09-11T11:16:37+02:00 From: Lene Antonsen <>
To: Ciprian Gerstenberger <>
CC: borre.gaup, sjur.n.moshagen, trond.trosterud
Last updated: 2014-04-10T08:50:54+02:00