giellalt / shared-smi

Shared Sámi lexical resources
GNU General Public License v3.0
2 stars 0 forks source link

Tagging av derivasjoner av proper nouns ( #5

Open albbas opened 3 years ago

albbas commented 3 years ago

This issue was created automatically with bugzilla2github

Bugzilla Bug 2701

Date: 2020-11-01T11:07:20+01:00 From: Lene Antonsen <> To: Sjur Nørstebø Moshagen <> CC: inga.l.mikkelsen, lene.antonsen, linda.wiechetek, sjur.n.moshagen, trond.trosterud, @unhammer@fsfe.org

Last updated: 2021-10-30T09:52:59+02:00

albbas commented 3 years ago

Comment 14099

Date: 2020-11-01 11:07:20 +0100 From: Lene Antonsen <>

Det er problemer med tagginga av derivasjoner av proper nouns ved tilpassing til Apertium. Følgende to dervisjoner burde gå an å generere i Apertium, bruke transferegler for å gå fra den ene til den andre, men det fungerer ikke pga av taggene, vi får ikke (ex_np?)

F.eks. i lang-smj: echo guovddagæjnok| hfst-lookup -q tools/mt/apertium/analyser-mt-apertium-desc.und.hfstol guovddagæjnok Guovddagæjnno 0,000000 guovddagæjnok Guovddagæjnno 0,000000

i lang-sme: echo guovdageaidnulaš| hfst-lookup -q tools/mt/apertium/analyser-mt-apertium-desc.und.hfstol guovdageaidnulaš Guovdageaidnu 0,000000 guovdageaidnulaš Guovdageaidnu

echo guovdageaidnulaš |apertium -d. sme-smj-biltrans ^guovdageaidnulašn><sg><nom><@HNOUN/Guovddagæjnnonp><sem_plc><der_k><n><sg><nom><@HNOUN$^./.$

albbas commented 3 years ago

Comment 14100

Date: 2020-11-01 11:58:17 +0100 From: Lene Antonsen <>

Den siste analysen i apertium kom fra denne entryen:

guovdageaidnulašGuovddagæjnno

Men når jeg kommenterer ut den, så blir de ikke gjenkjent:

echo guovdageaidnulaš |apertium -d. sme-smj ^guovdageaidnulaš/guovdageaidnulaš$^./.$

echo guovddagæjnok |apertium -d. sme-smj ^guovddagæjnok/guovddagæjnok$^./.$

albbas commented 3 years ago

Comment 14102

Date: 2020-11-02 10:24:27 +0100 From: @unhammer@fsfe.org

Eg veit ikkje kor "N Prop" blir til "" i fst-en, men på same stad burde jo "Ex/N Prop" bli til "".

Når det gjeld CG, så ser eg at me har linjer som SUBSTITUTE:apertium-unhide-derivtags (ex_n) (n) TARGET (ex_n) ; SUBSTITUTE:apertium-unhide-derivtags SUB:1 (ex_n) (n) TARGET (ex_n) ; i giella-shared/smi/src/{cg3,syntax}/functions.cg3

men det manglar

SUBSTITUTE:apertium-unhide-derivtags (ex_np) (np) TARGET (ex_np) ; SUBSTITUTE:apertium-unhide-derivtags SUB:1 (ex_np) (np) TARGET (ex_np) ;

og lang-smj/tools/mt/apertium/tagsets/gt2apertium.cg3relabel har

MAP (Ex/N) (ex_n);

men burde kanskje ha

MAP (Ex/N Prop) (ex_np); MAP (Ex/N) (ex_n) OR (ex_np);

(på same måte som for vanleg Prop og N)

albbas commented 3 years ago

Comment 14145

Date: 2020-11-23 15:21:41 +0100 From: Lene Antonsen <>

Jeg trenger hjelp fra Sjur til denne. Jeg har prøvd med dette i tools/mt/apertium/tools/mt/apertium/ "" -> "" , "+Ex/N+Prop" -> "" ,

men det fungerer ikke, jeg tror dette må fikses i giella-core/am-shared/tools-mt-apertium-tagsets-dir-include.am ?

echo norgalaš |hfst-lookup tools/mt/apertium/analyser-mt-apertium-desc.und.hfstol norgalaš Norga 0,000000 norgalaš Norga 0,000000 norgalaš Norga 0,000000 norgalaš Norga 0,000000

Her ønsker vi norgalaš Norga

albbas commented 2 years ago

Comment 14219

Date: 2021-10-27 21:38:42 +0200 From: Sjur Nørstebø Moshagen <>

(In reply to Lene Antonsen from comment #3)

Jeg trenger hjelp fra Sjur til denne. Jeg har prøvd med dette i tools/mt/apertium/tools/mt/apertium/ "" -> "" , "+Ex/N+Prop" -> "" ,

men det fungerer ikke, jeg tror dette må fikses i giella-core/am-shared/tools-mt-apertium-tagsets-dir-include.am ?

Du var veldig nære med det fyste forsøket, ein fungerande versjon finst i innsjekkinga her:

https://github.com/giellalt/lang-sme/commit/992924c7a7d63a0f02cb5d48e0b884fd47cbadbb

"<ex_n><prop>"       -> "<ex_np>" ,

Dette var nesten rett, det som mangla var at du burde hatt hermeteikn rundt begge dei to taggane på venstre side:

 "<ex_n>" "<prop>"       -> "<ex_np>" ,

Slik ser analysane ut no:

echo norgalaš | hfst-lookup -q tools/mt/apertium/analyser-mt-apertium-desc.und.hfstol norgalaš norgalaš 0,000000 norgalaš norgalaš 0,000000 norgalaš Norga 0,000000 norgalaš Norga 0,000000 norgalaš Norga 0,000000 norgalaš Norga 0,000000 norgalaš Norga 0,000000 norgalaš Norga 0,000000 norgalaš Norga 0,000000 norgalaš Norga 0,000000 norgalaš norgalaš 0,000000 norgalaš norgalaš 0,000000 norgalaš norgalaš 0,000000 norgalaš norgalaš 0,000000

Eg har berre endra for sme, men no burde det vera rett fram å få dette til for andre språk. Sei frå om det dukkar opp andre problem.

Eg lar lusmeldinga vera open til du har stadfesta at alt er ok / til alle språk er fiksa.

albbas commented 2 years ago

Comment 14228

Date: 2021-10-29 00:31:30 +0200 From: Lene Antonsen <>

Det fungerer i apertium:

echo porsáŋgulaš |apertium -d. sme-smj-biltrans ^porsáŋgulašn><sem_hum><sg><nom><@HNOUN/Porsáŋŋgonp><sem_plc><der_k><n><sg><nom><@HNOUN$^./.$

albbas commented 2 years ago

Comment 14229

Date: 2021-10-29 08:06:46 +0200 From: Lene Antonsen <>

Jeg tenekte feil da jeg testet. porsáŋgulaš var leksikalisert i bidix, og poenger var nettopp at vi ikke skal trenge å leksikalisere. porsáŋgulaš Porsáŋgu+N+Prop+Sem/Plc+Der/lasj+A+Sg+Nom

Jeg må legge dette inn i smj og Makefile i apertium. skal teste på nytt

albbas commented 2 years ago

Comment 14230

Date: 2021-10-30 09:52:59 +0200 From: @unhammer@fsfe.org

$ echo guovdageaidnulaš|apertium -d . sme-smj-morph ^guovdageaidnulaš/Guovdageaidnu/Guovdageaidnu/Guovdageaidnu/Guovdageaidnu/guovdageaidnulaš$^./.$

i nyaste sme-smj