giellalt / bugzilla-dummy

0 stars 0 forks source link

Skript for oppdatering av semtagger til forskjellige applikasjoner (Bugzilla Bug 2689) #1488

Open albbas opened 4 years ago

albbas commented 4 years ago

This issue was created automatically with bugzilla2github

Bugzilla Bug 2689

Date: 2020-10-12T23:35:19+02:00 From: Lene Antonsen <> To: Sjur Nørstebø Moshagen <> CC: borre.gaup, chiara.argese, linda.wiechetek, thomas.omma, trond.trosterud

Last updated: 2022-02-28T11:07:22+01:00

albbas commented 4 years ago

Comment 14048

Date: 2020-10-12 23:35:19 +0200 From: Lene Antonsen <>

Vi hadde et møte om å lage skript for å enkelt kunne oppdatere semtagger til forskjellige applikasjoner: https://giellalt.uit.no/admin/linguists/190604_semtags.html

Dette burde følges opp. Ved at nye semtagger ikke blir lagt til i cg3 filer og Apertium filer, blir output fra disambiguering og MT dårligere enn det kunne være. Manuell oppdatering er tungvint. Skripting vil også sikre like bra kvalitet for alle samiske språk som bruker semtagger.

albbas commented 2 years ago

Comment 14233

Date: 2022-02-28 11:07:22 +0100 From: Sjur Nørstebø Moshagen <>

I innsjekkinga her: https://github.com/giellalt/giella-core/commit/5099317f8dbf61460b45c24602f3d11e9a8dc12b har eg lagt til støtte for å inkludera alle taggar i lexc automatisk i cg3-filer.

Det er enno eit par steg før vi er i mål:

Det siste kan løysast på i alle fall to måtar:

Ingen av desse er optimale, og det er lettare å diskutera detaljane + ulemper og fordelar i eit møte enn her.