giellalt / lang-sma

Finite state and Constraint Grammar based analysers and proofing tools, and language resources for the Southern Sami language
https://giellalt.uit.no
GNU General Public License v3.0
2 stars 3 forks source link

Rydde i Use/NG og v1,v2 og Hom1,Hom2 (Bugzilla Bug 1753) #30

Open albbas opened 10 years ago

albbas commented 10 years ago

This issue was created automatically with bugzilla2github

Bugzilla Bug 1753

Date: 2013-12-14T11:57:56+01:00 From: Lene Antonsen <> To: Maja Lisa Kappfjell <> CC: lene.antonsen, sjur.n.moshagen, thomas.omma, trond.trosterud

Last updated: 2016-12-15T13:10:02+01:00

albbas commented 10 years ago

Comment 8759

Date: 2013-12-14 11:57:56 +0100 From: Lene Antonsen <>

Rydde i Use/NG og v1,v2 og Hom1,Hom2

Vi bør ha en gjennomgang av bruk av disse taggene i sma-leksikonet. Jeg har sett på verb-leksikonet pga v problemer med genereringa.

Use/NG betyr "ikke generer" og når alle oppføringer av et verb har taggen Use/NG og eller Use/Sub, så vil ikke verbet la seg generere i fsten som brukes til MT og Oahpa. Eksempler fra verbfila:

arhkanidh+Use/Sub:arkan RIHPESIDH ; arhkanidh+Use/Sub:larkan RIHPESIDH ; arhkanidh+Use/Sub:larhkan RIHPESIDH ; arhkanidh+Use/NG:arhkan RIHPESIDH "plötsligt slå sej, (;bli lemlestet)" ; arhkanidh+Use/NG:arhken RIHPESIDH "plötsligt slå sej " ; arhkanidh+Use/Sub:larhken RIHPESIDH "plötsligt slå sej " ;

doksedh+Use/NG:doks BÅÅHKEDH_TV "samla förråd" ; doksedh+Use/NG:doks VÅÅJNEDH ;

pluss mange flere.

Når ordet har flere mulige bøyningsmønstre, men semantikken ikke endrer seg, så bør man bruke v1,v2, slik som det er gjort her:

jovkedh+v1:jovk TJOEHPEDH_TV "dricka" ; jovkedh+v2+Use/NG:jovhk TJOEHPEDH_TV "dricka" ; måarahtovvedh+v1:måarahtovv SOVVEDH ; måarahtovvedh+v2+Use/NG:måaratovv SOVVEDH ;

For å få mest mulig stabilitet i taggene ved generering for MT, foreslår jeg at vi heller gjør slik: jovkedh:jovk TJOEHPEDH_TV "dricka" ; !column 3 !V60 jovkedh+v2:jovhk TJOEHPEDH_TV "dricka" ; !

Dvs at den første varianten ikke får noen tagg (og vi unngår å måtte legge inn v1 i bidix), og den andre merkes med v2 og da trenger man ikke Use/NG fordi de formene uansett blir filtrert bort for MT og Oahpa.

I noen tilfeller er det merket Use/NG når det er snakk om to forskjellige lemmaer med homonymi i grunnform, f.eks.

dahkedh+Use/NG:dahk GUARKEDH_TV "få den värsta hungern stillad" ; dahkedh:dahk TJOEHPEDH_TV "göra" ;

Her skal vi bruke Hom1 og Hom2, ikke Use/NG.

Vi må også se på filtrene for kompileringa. Use/NG skal filtreres bort bare for MT og Oahpa, ikke for dict. Ordboka skal nemlig kjenne alle formene.

albbas commented 10 years ago

Comment 8764

Date: 2013-12-15 23:43:09 +0100 From: Lene Antonsen <>

Vi trenger fster for generering og analyse for ordboka, slik at jeg har nå endret verb-fila i henhold til det jeg har beskrevet ovenfor. Hvis Maja ønsker en annen løsning, kan hun evt. reversere før hun endrer.

albbas commented 10 years ago

Comment 8782

Date: 2013-12-17 09:40:15 +0100 From: Maja Lisa Kappfjell <>

ok. da begynner jeg med denne oppmerkingen etterhvert. Maja

albbas commented 7 years ago

Comment 11860

Date: 2016-12-15 13:10:02 +0100 From: Lene Antonsen <>

Det gjelder disse verbene som er flere ganger:

Den ene IV og den andre TV. Hvis det er riktig at det finnes to betydniger av verbene, så bruk +Hum1 go +Hum2 aelhkiedidh:aelhkied GOLTELIDH_IV ; aelhkiedidh:aelhkied GOLTELIDH_IV ;

hojjestalledh:hojjestall GOEGKERDADTEDH_TV "hålla på och beklaga sig" ; hojjestalledh:hojjestall GOEGKERDADTEDH_IV ;

konkludeeredh:kon^klude EEREDH_IV ; konkludeeredh:konklude EEREDH_TV ;

Her går verbene til forskjellige bøyningsmønstre. Hvis forskjellig betydning: +Hum1 og +Hum2. Hvis samme betydning, men bare varianter: +v1 og +v2 jåtskedh:jåtsk TJOEHPEDH_IV "bli tilgriset" ; jåtskedh:jåtsk GUARKEDH_IV "bli tilgriset" ;

gåvtjedh:gåvtj GUARKEDH_IV ; gåvtjedh:gåvtj TJOEHPEDH_IV "falle på ryggen, falle overende (om mennesker), slenge hodet bakover (om spebarn)" ;