giellalt / lang-sme

Finite state and Constraint Grammar based analysers and proofing tools, and language resources for the Northern Sami language
https://giellalt.uit.no
GNU General Public License v3.0
6 stars 1 forks source link

PlGen#gaskasaš sammensetninger ( #357

Open albbas opened 7 years ago

albbas commented 7 years ago

This issue was created automatically with bugzilla2github

Bugzilla Bug 2281

Date: 2016-11-30T19:53:42+01:00 From: Lene Antonsen <> To: Thomas Omma <> CC: lene.antonsen, linda.wiechetek, sandra.rahka, sjur.n.moshagen, trond.trosterud

Last updated: 2016-12-01T09:48:13+01:00

albbas commented 7 years ago

Comment 11748

Date: 2016-11-30 19:53:42 +0100 From: Lene Antonsen <>

Jeg har sett på PlGen#gaskasaš sammensetninger i korpus, se lista under her. Ingen av dem får dynamisk #gaskasaš analyse, istedenfor får de #gaskkas+N+Der/Dimin+N

f.eks. ilmmiidgaskasaš ilbmi+N+Cmp/PlGen+Cmp#gaskkas+N+Der/Dimin+N+Sg+Nom

Noen feilstavinger blir godtatt fordi de blir analysert som sammensetning med #gaskkas uten Der/Dimin:

ilmmiidgaskasa ilbmi+N+Cmp/PlGen+Cmp#gaskkas+N+Sg+Gen

Forslag: Legge til Cmp gaskasaš til +Cmp/PlGen+Cmp# stien, og samtidig legge tagger til for å hindre sisteledd sammensetning med gaskkas.

agiidgaskasaš albmogiidgaskasaš bohccuidgaskasaš buolvvaid-gaskasaš buolvvaidgaskasašortnegat davviriikkaidgaskasaš diehtagiidgaskasaš eatnamiidgaskasaš fitnodagaidgaskasaš fylkkagielddaidgaskasaš fylkkaidgaskasaš fágadepartementtaidgaskasaš fágaidgaskasašvuohta gielaidgaskasašguovlu gielddaidgaskasašlávdegoddi giliidgaskasaš guovlluidgaskasaš hálddašandásiidgaskasaš ilmmiidgaskasaš joavkkuidgaskasaččat museaidgaskasaš máilmmesođiidgaskasaš nuoraidgaskasaš ohppiidgaskasaš regiovnnaidgaskasaš riikkagaskasaš ráđđehusaidgaskasaš sektuvrraidgaskasaš skuvllaidgaskasaš sohkabeliidgaskasaš stáhtaid-gaskasaš suohkaniidgaskasaš surggiidgaskasaš tuvrraidgaskasaš vuoigatvuođaidgaskasaš álbmogiidgaskasašbeaivin álgoálbmogiidgaskasaš álgoálbmotriikkaidgaskasaš čearddaidgaskasaš čoagganemiidgaskasaš

albbas commented 7 years ago

Comment 11753

Date: 2016-12-01 09:30:23 +0100 From: Thomas Omma <>

maybe that is good idea

I put in the compounds:

sme $ svn ci -m "compounds bug2281" src Sending src/morphology/stems/adjectives.lexc Sending src/morphology/stems/nouns.lexc Transmitting file data .. Committed revision 144691.

albbas commented 7 years ago

Comment 11754

Date: 2016-12-01 09:48:13 +0100 From: Lene Antonsen <>

(In reply to Thomas Omma from comment #1)

maybe that is good idea

I put in the compounds:

sme $ svn ci -m "compounds bug2281" src Sending src/morphology/stems/adjectives.lexc Sending src/morphology/stems/nouns.lexc Transmitting file data .. Committed revision 144691.

Denne kommentaren er veldig kryptisk. Det hadde vært fint om Thomas kunne kommentere her i bz hva han har gjort.

Det er to strategier her: 1) leskikalisere alle -gaskasaš som dukker opp i korpus 2) legge inn sti til gaskasaš i +Cmp/PlGen+Cmp# stien

Jeg ser i innsjekkinga at Thomas følger strategi 1) og ikke nummer 2)

Fra Giellateknos ståsted så ønsker vi strategi 2 fordi strategi 1 ikke er produktiv, og fordi vi ikke får informasjon om Cmp i analysen. En slik sti vil ikke lage flere Cmp enn vi allerede har pga av at substantivet gaskkas inngår i Cmp. Men Divvun kan også legge inn Use/-Spell-tagg eller liknende hvis ønskelig.

Jeg ber om kommentar til dette.