Open albbas opened 8 years ago
Date: 2016-10-17 12:59:53 +0200
From: Lene Antonsen <
prefix ii- fungerer ikke som det skal
Her får vi flere typer Err-tagger, men hovedproblemet er former som +Err/Orthstáhta. Årsaka er compunding.lexc: ii-+Err/Orth+Use/Circ:ii- Noun ; ii-+Err/Orth+Use/Circ:ii- Adjective ; ! ii-biologalaš
Men det går flere stier.
usme ii-stáhtalaš ii-stáhtalaš ii-+N+Err/HyphSub+Cmp/SgNom+Cmp/Hyph+Cmp#stáhta+Err/Orth+N+Der/lasj+A+Attr ii-stáhtalaš ii-+N+Err/HyphSub+Cmp/SgNom+Cmp/Hyph+Cmp#stáhta+Err/Orth+N+Der/lasj+A+Sg+Nom ii-stáhtalaš ii-+N+Err/HyphSub+Cmp/SgNom+Cmp/Hyph+Cmp#stáhta+v1+N+Der/lasj+A+Attr ii-stáhtalaš ii-+N+Err/HyphSub+Cmp/SgNom+Cmp/Hyph+Cmp#stáhta+v1+N+Der/lasj+A+Sg+Nom ii-stáhtalaš ii-+N+Err/HyphSub+Cmp/SgNom+Cmp/Hyph+Cmp#stáhta+Err/Orth+N+Der/lasj+A+Attr ii-stáhtalaš ii-+N+Err/HyphSub+Cmp/SgNom+Cmp/Hyph+Cmp#stáhta+Err/Orth+N+Der/lasj+A+Sg+Nom ii-stáhtalaš ii-+N+Err/HyphSub+Cmp/SgNom+Cmp/Hyph+Cmp#stáhta+v1+N+Der/lasj+A+Attr ii-stáhtalaš ii-+N+Err/HyphSub+Cmp/SgNom+Cmp/Hyph+Cmp#stáhta+v1+N+Der/lasj+A+Sg+Nom ii-stáhtalaš ii-+Err/Orthstáhta+Err/Orth+N+Der/lasj+A+Attr ii-stáhtalaš ii-+Err/Orthstáhta+Err/Orth+N+Der/lasj+A+Sg+Nom ii-stáhtalaš ii-+Err/Orthstáhta+v1+N+Der/lasj+A+Attr ii-stáhtalaš ii-+Err/Orthstáhta+v1+N+Der/lasj+A+Sg+Nom ii-stáhtalaš ii-+Err/Orthstáhtalaš+A+Attr ii-stáhtalaš ii-+Err/Orthstáhtalaš+A+Sg+Nom
Date: 2016-10-17 13:00:36 +0200
From: Lene Antonsen <
Setter Ciprian som CC fordi dette har konsekvenser for korpus
Date: 2016-10-17 14:16:00 +0200
From: Sjur Nørstebø Moshagen <
Dette er det eg får med den nye tokeniseringa:
$ echo "ii-stáhtalaš" |hfst-tokenise --giella-cg tools/preprocess/tokeniser-disamb-gt-desc.pmhfst
"<ii-stáhtalaš>"
"ii-" Err/Orth "stáhta" Err/Orth NN Sem/Org Der/lasj A Attr
Og det ser jo ikkje bra ut. Men eg forstår ikkje heilt på kva slags måte vi kan unngå å få Err/Orth midt i lemma-strengen, fordi det nettopp er bruken av ii- som er problematisk.
Date: 2016-10-17 18:43:05 +0200
From: Trond Trosterud <
Kan vi ikkje bruke taggen +Err/Orth+ for prefiks? Altså + til slutt, jf.
echo "ii-stáhtalaš ii-+Err/Orth+stáhtalaš+A+Sg+Nom"|lookup2cg "<ii-stáhtalaš>" "ii-" Err/Orth stáhtalaš A Sg Nom
Date: 2016-12-14 23:07:43 +0100
From: Lene Antonsen <
Jeg kommenterte ut stien fra compounds-fila, og no har vi denne stien fra nouns: ii-stáhtalaš ii-+N+Err/Lex+Cmp/SgNom+Cmp/Hyph+Cmp#stáhta+v1+N+Der/lasj+A+Attr
Jeg foreslår å endre +N til +V
sme$ echo ii-stáhtalaš | usmedis | lookup2cg "<ii-stáhtalaš>" "ii-#stáhta" NN Sem/Org Der/lasj A Attr "ii-#stáhta" NN Sem/Org Der/lasj A Sg Nom
Date: 2016-12-17 21:57:06 +0100
From: Trond Trosterud <
Det er det for så vidt eit godt argument for (ii = +V)
Date: 2016-12-19 08:43:25 +0100
From: Thomas Omma <
it is good to do that? to: endre +N til +V
This issue was created automatically with bugzilla2github
Bugzilla Bug 2231
Date: 2016-10-17T12:59:53+02:00 From: Lene Antonsen <>
To: Thomas Omma <>
CC: ciprian.gerstenberger, lene.antonsen, linda.wiechetek, sandra.rahka, sjur.n.moshagen, trond.trosterud
Last updated: 2016-12-19T08:43:25+01:00