giellalt / bugzilla-dummy

0 stars 0 forks source link

endring av pipe-line for sme (cgi) (Bugzilla Bug 1712) #1350

Closed albbas closed 10 years ago

albbas commented 11 years ago

This issue was created automatically with bugzilla2github

Bugzilla Bug 1712

Date: 2013-09-11T11:16:37+02:00 From: Lene Antonsen <> To: Ciprian Gerstenberger <> CC: borre.gaup, sjur.n.moshagen, trond.trosterud

Last updated: 2014-04-10T08:50:54+02:00

albbas commented 11 years ago

Comment 8504

Date: 2013-09-11 11:16:37 +0200 From: Lene Antonsen <>

Det må inn endringer av pipe-line for sme (cgi)

pipeline for setningsanalyse skal endres slik pga av modulering av CG-analysen:

vislcg3 -g sme/src/sme-dis.rle | vislcg3 -g sme/src/smi-syn.rle

(etterhvert skal smi-syn.rle flyttes over i smi/src - men den er ikke testa og tilpassa for andre språk enda., Vi kan evt flytte den over allerede nå, hvis det er en fordel for pipeline)

Den andre endringen er delvis gjort allerede:

my $fst_without_semtags = "$fstdir/$lang-site.fst";

til bruk i analysen før paradigmegenereringa. Jeg ønsker at sme-site.fst også skal brukes i analysen av enkeltord, for å holde gjøre analysen mer forståelig for brukerne. Men i pipeline for setningsanalyse, må vi bruke sme.fst.

Kompileringa av sme-site.fst gjøres no manuelt og kopieres til /opt/, men dette bør inn i Makefile. Jeg skriver en egen bz på dette

albbas commented 11 years ago

Comment 8505

Date: 2013-09-11 11:35:11 +0200 From: Lene Antonsen <>

Kompileringa av sme-site.fst gjøres no manuelt og kopieres til /opt/, men dette bør inn i Makefile. Jeg skriver en egen bz på dette

Dette var ikke helt korrekt. Det blir kompilert en sme-site.fst, men den fungerer ikke helt som tenkt:

$LOOKUP $GTHOME/gt/sme/bin/sme-site.fst áhkku áhkku+Sem/Hum+N+Sg+Nom

Men dette hører til en annen bz

albbas commented 11 years ago

Comment 8509

Date: 2013-09-13 08:55:10 +0200 From: Lene Antonsen <>

(> Jeg ønsker at sme-site.fst også skal brukes i analysen av enkeltord, for å

holde gjøre analysen mer forståelig for brukerne. Dette er fiksa.

albbas commented 11 years ago

Comment 8512

Date: 2013-09-17 13:15:38 +0200 From: Lene Antonsen <>

(In reply to comment #0)

Det må inn endringer av pipe-line for sme (cgi)

pipeline for setningsanalyse skal endres slik pga av modulering av CG-analysen:

vislcg3 -g sme/src/sme-dis.rle | vislcg3 -g sme/src/smi-syn.rle

Jeg så i conf.pl, men jeg tror det er bedre at dette gjøres av Ciprian som kan dette. Det er flere ting som må tas hensyn til:

  1. i conf.pl brukes nå $dis_bin og $dep_bin (med binære filer - det bør endres til $dis_rle og $dep_rle. Den siste er ikke definert.

  2. For sme: hverken syn og dep har ikke 'lang' som fornavn, men 'smi',

  3. forsløpig er det bare sme som bruke den modulære pipelinen og dermed må det lages egne definisjoner (elsif) for denne.

albbas commented 11 years ago

Comment 8514

Date: 2013-09-17 13:42:45 +0200 From: Trond Trosterud <>

Bug #1714 has been marked as a duplicate of this bug.

albbas commented 11 years ago

Comment 8515

Date: 2013-09-17 13:44:10 +0200 From: Trond Trosterud <>

Fiksa.

Merk at eg ikkje har retta opp i tekst vs. binær.

albbas commented 11 years ago

Comment 8520

Date: 2013-10-02 08:04:13 +0200 From: Trond Trosterud <>

Fiksa, men ikkje lukka. Eg lukkar no.

albbas commented 10 years ago

Comment 8965

Date: 2014-01-22 00:56:10 +0100 From: Lene Antonsen <>

Pipeline må oppdateres, har gjort et forsøk i conf.pl

For sme/smj/sma skal grammatikken være (vislcg3 -g …….)

for disambiguering: langs/smX/src/syntax/disambiguation.cg3

for syntaktisk analyse: gtcore/gtdshared/smi/src/syntax/functions.cg3

for dependens: gtcore/gtdshared/smi/src/syntax/dependency.cg3

albbas commented 10 years ago

Comment 8966

Date: 2014-01-22 00:58:37 +0100 From: Lene Antonsen <>

Glemte at alle analysatorene ligger i /opt/smi/smX/bin

=> bare filnavnet skal endres for disambiguering: disambiguation.cg3 for syntaktisk analyse: functions.cg3

for dependens: dependency.cg3

Jeg foreslår at vi ikke bruker binære filer, men cg3 istedenfor.

albbas commented 10 years ago

Comment 9271

Date: 2014-04-10 08:50:21 +0200 From: Trond Trosterud <>

Vi bruker no .cg3-filer i conf.pl. Eg lukkar buggen.

albbas commented 10 years ago

Comment 9272

Date: 2014-04-10 08:50:54 +0200 From: Trond Trosterud <>

Å seie det, ja, men å gjere det...