giellalt / lang-sme

Finite state and Constraint Grammar based analysers and proofing tools, and language resources for the Northern Sami language
https://giellalt.uit.no
GNU General Public License v3.0
6 stars 1 forks source link

Adjektiv og Px ( #243

Closed albbas closed 8 years ago

albbas commented 10 years ago

This issue was created automatically with bugzilla2github

Bugzilla Bug 1776

Date: 2014-01-12T12:30:25+01:00 From: Lene Antonsen <> To: Thomas Omma <> CC: berit.a.baal, berit.nystad.eskonsipo, lene.antonsen, linda.wiechetek, ritva.nystad, sandra.rahka, sjur.n.moshagen, trond.trosterud

Last updated: 2016-07-25T15:57:26+02:00

albbas commented 10 years ago

Comment 8882

Date: 2014-01-12 12:30:25 +0100 From: Lene Antonsen <>

Dette er en sak vi har diskutert for mange år siden, og adjektivenes Px-stier blei da subbet. Jeg tar et par sider ved denne saka opp igjen nå.

Stiene ble dengang 'subbet', men i ettertid har vi fått Use/-Speller-tag, og det er vel den riktige? Spesielt når vi gjør Use/Sub-taggen synlig i analysene, vil det være uheldig. Use/Sub påvirker også den normative fst-en.

Jeg får 1044 treff på [pos = "A" & msd = ".Px."] i Korp-grensesnittet og ser at de aller, aller fleste treffene jeg får, ikke er reelle, men feildisambiguering, eller resultat av hull i fst. Men jeg finner noen reelle, og dette er vel noe Thomas bør se på, slik at de kommer med i speller.

Disse har stier til Px som N, og er derfor med i Divvun likevel: boaris Nuoraid moitet go eai fuolat boarrásiiddiset seamma láhkai go boarrásat sis atnet árvvu . nuorra mii heađusta ovdáneami ja dagaha stuorra váttisvuođaid nuoraidasamet sin boahtteáiggi birgemis . buorre Son addá midjiide valljugasat buot buriidis, vai mii beassat návddašit daid .

Disse er ikke leksikaliserte som N: ipmilbalolaš Son várjala ipmilbalolaččaidis heakka ráhkis <=== denne har også Nom! Ráhkkásiiddán, fasttášehket nappo eahpeipmilbálvaleami ! <=== denne har også Nom! vistelágaš Väkkäräinen fárrii vistelágážisttis Krooka bartii Riika lusa ja orodii das vel geassitge

Slik kan man finne eksempler i Korp: [lemma = "vistelágaš" & msd = ".Px."]

albbas commented 10 years ago

Comment 8921

Date: 2014-01-13 11:07:21 +0100 From: Thomas Omma <>

gt $ svn ci -m "Sub changed to -Spell according to Bug1776, some nouns added" sme/srcSending sme/src/adj-sme-morph.txtSending sme/src/noun-sme-lex.txtTransmitting file data ..Committed revision 86706.gt $

albbas commented 10 years ago

Comment 9029

Date: 2014-01-29 08:17:54 +0100 From: Lene Antonsen <>

Jeg reåpner denne fordi det er greit å samle flere eksempler med A Px fra korpus i samme bug. Jeg foreslår at denne står åpen en stund mens vi arbeider med Korp.

Neste ord på lista er buoremusaset, fasttát?, láhkásaččaidasaset, vártnuhemiidat:

Sii oidne ođđa áiggi ja dahke buoremusaset. – Duo veallá fasttát ja sulastahttá oalle ládje spiinni , dajai son . <== fasttát ? Dan láhkái olbmot leat geahččalan alcceseaset ja láhkásaččaidasaset addit alit árvvu dege rivvet ovdamuniid . Ale atte turtelduvvát spiriide , ale vajáldahte vártnuhemiidat heakka .

albbas commented 10 years ago

Comment 9583

Date: 2014-09-16 10:55:06 +0200 From: Thomas Omma <>

hmmm. fasttát ska i vært fall være fasttat

albbas commented 10 years ago

Comment 9600

Date: 2014-09-26 11:13:43 +0200 From: Thomas Omma <>

sme $ svn ci -m "adding the nouns from Bug1776" src Sending src/noun-sme-lex.txt Sending src/noun-sme-morph.txt Transmitting file data .. Committed revision 100204.

albbas commented 10 years ago

Comment 9601

Date: 2014-09-26 13:25:13 +0200 From: Lene Antonsen <>

Eksempler på A Px fra Anders Larsen Beaiveálgu som Thomas kan vurdere om skal legges inn i Divvun:

ovddežiinnát buoremusaideaset (superlativ!)

Giittus ovddežiinnát! (s 17) Nuorra olbmot geat ledje buoremusaideaset alde (s 67)

Anders Larsen 2013 (1912): Beaiveálgu. Kárášjohka: Čálliid Lágadus.

albbas commented 9 years ago

Comment 9853

Date: 2014-12-01 14:04:57 +0100 From: Lene Antonsen <>

Fra gamle testamentet, to superlativer med Px: boarráseamos og nuoramus 5 44:12 Dállodoalli ohcagođii, ja son álggii boarrásepmosis ja loahpahii nuoramusas, ja juhkanlihtti gávdnui Benjamina seahkas .

albbas commented 9 years ago

Comment 9858

Date: 2014-12-02 09:08:17 +0100 From: Lene Antonsen <>

Det er noen få adjektiver som får Px. Nå har løsninga vært å legge dem inn som substantiver. Hadde det vært en bedre ide å løse dette i adjektivfila slik at vi opprettholder A som analyse?

Enten 1) å ha eget kontinuasjonsleksikon for ordene (hvis det ikke betyr at man må fragmentere systemet for mye) eller 2) å lage et eget leksikon i adjektivfila som heter f.eks. AdjektivesPx og så bruke flaggdiakritika? Da vil det være enkelt å flytte adjektiver inn i dette leksikonet, etterhvert som vi finner dem dokumentert med Px.

albbas commented 9 years ago

Comment 9859

Date: 2014-12-02 09:32:06 +0100 From: Thomas Omma <>

sme $ svn ci -m "words according to Bug1776 and 1777" src Sending src/morphology/stems/adverbs.lexc Sending src/morphology/stems/nouns.lexc Transmitting file data .. Committed revision 103611.

albbas commented 9 years ago

Comment 9869

Date: 2014-12-08 11:47:38 +0100 From: Thomas Omma <>

(In reply to comment #7)

Det er noen få adjektiver som får Px. Nå har løsninga vært å legge dem inn som substantiver. Hadde det vært en bedre ide å løse dette i adjektivfila slik at vi opprettholder A som analyse?

Enten 1) å ha eget kontinuasjonsleksikon for ordene (hvis det ikke betyr at man må fragmentere systemet for mye) eller 2) å lage et eget leksikon i adjektivfila som heter f.eks. AdjektivesPx og så bruke flaggdiakritika? Da vil det være enkelt å flytte adjektiver inn i dette leksikonet, etterhvert som vi finner dem dokumentert med Px.

I don't know, seems like one to me :/

albbas commented 9 years ago

Comment 9870

Date: 2014-12-09 12:08:23 +0100 From: Trond Trosterud <>

Det å ha adjektiv med Px som N for å få fst til å gå opp er eit hack, som eg ikkje er begeistra for. Det er betre å la dei vere A. Då veit vi at dei er A, og vi slepp å få ein umotivert dobling av resten av paradigmet berre fordi det er eit adjektiv med Px vi har med å gjere.

Til Lenes 1 vs 2:

Eg er skeptisk til å ha eigne kontinuasjonsleksika for eit så marginalt system (dvs. 1), det er ein hög pris å betale å doble alt (og vi betaler denne prisen for mange fenomen allereie). Systemet gjev enkle lexc-stiar og krev lite ettertanke når vi lagar det, men resultatet blir mange lexc-stiar og spesielt mange leksika. Ut over det at du unngår flaggdiakritika og bruker eit enkelt konsept (contlex) ser eg heller ingen fordelar med alternativ 1.

Eg går inn for 2: Å ha eit eige leksikon Adjectives, og å bruke flaggdiakritika. Det förer til at leksikonstrukturen for adjektiv blir halde på same nivå som för, og at vi får eit fleksibelt system. Grunne til dette er at eg meiner vi bör vere forsiktig med å doble talet på kontinuasjonsleksika. Gjer vi det fleire gonger får vi eksponensiell vekst (2 x 2 x 2 ...) i talet på leksika. Det at vi allereie har gjort det ein del gonger (for transitivitet, for semantikk i stadnamna, for sluttvokal, ...) gjer at den metoden på ein måte er "brukt opp". Ei dobling (for stadnamn til og med femdobling) kan vi leve med, men det förer også til at vi ikkje kan legge fleire leksikon-splitt oppå dei vi har, til tjuefemdoblingar, osb.

albbas commented 9 years ago

Comment 9871

Date: 2014-12-09 13:11:04 +0100 From: Lene Antonsen <>

Jeg har lagt til flaggdiakritika. Ved å bruke ADJ foran Px-leksikonet, f.eks. ADJPx3V, vil stien kreve @P.Px.add@. Dvs at det bare er adjektivene i AdjectivePx-leksikonet som får Px.

Author: lene Date: 2014-12-09 11:09:05 +0100 (maŋ, 09 juov 2014) New Revision: 104138

Modified: trunk/langs/sme/src/morphology/affixes/adjectives.lexc trunk/langs/sme/src/morphology/affixes/nouns.lexc trunk/langs/sme/src/morphology/root.lexc trunk/langs/sme/src/morphology/stems/adjectives.lexc trunk/langs/sme/src/morphology/stems/nouns.lexc Log: Bz. 1776. Jeg lage et leksikon AdjectivePx for adjektiver som får Px-endinger, uavhengig av contlex. Jeg la ord som er funnet i korpus til dette leksikonet. Det er mange Err/Sub som skal bort, men jeg tar det i neste innsjekking. Taggen har vært brukt istedenfor Use/-Spell, men noen av dem er kanskje reelle. Med eget AdjectivePx trenger man ikke Use/-Spell-taggen heller. Fjerna noen av adjektivene som var lagt til som noun for å få Px-endinger. Flyttet leksikon fra noun til adj.

albbas commented 9 years ago

Comment 9873

Date: 2014-12-09 13:13:23 +0100 From: Lene Antonsen <>

Linda skal med som CC (det blei litt rot)

albbas commented 9 years ago

Comment 9875

Date: 2014-12-09 15:10:41 +0100 From: Lene Antonsen <>

Jeg har rydda mer i adjektivPx. Ordene som er lagt til i adjektivPx-leksikonet får Px-bøyning også i comp og superl, ikke alle får Essiv. Det er vel sannsynligvis ikke behov for essiv, men på den andre siden så er det snakk om bare 10-11 lemmaer. Jeg har stor sett fjerna Use/-Spell og Err/Sub. Men det er litt mer å rydde i, så vi får sjekke etterhvert som vi legger ord til i adjektivPx.

albbas commented 9 years ago

Comment 9913

Date: 2014-12-19 09:05:28 +0100 From: Lene Antonsen <>

Laget sti for Px for substantiver på samme måte som for adjektiver. Forskjellen er bare at NounRoot får Px, og et eget leksikon NounNoPx ikke får Px. Laget et eget NounKinPx leksikon, med et ekstra flagg for Nom Px3. Slo sammen ADJPx- og NPX-leksikonene, og har begynt tilsvarende en del andre kontianuasjonsleksikon som har vært skilt for adjektiver og substantiver pga av den måten vi tidligere begrensa Px forskjellig for disse ordklassene.

Default leksikonene er nederst i stems-filene:

Nå får vi adjektivanalyse for bl.a. disse: usmeNorm buoremusas buoremusas buorre+A+Superl+Sg+Gen+PxSg3 buoremusas buorre+A+Superl+Sg+Acc+PxSg3

vistelágážisttis vistelágaš+A+Sg+Loc+PxSg3

albbas commented 9 years ago

Comment 9961

Date: 2015-01-11 21:52:27 +0100 From: Trond Trosterud <>

Lene har oppsummert situasjonen.

Har nokon framlegg til testar for om dette er det vi vil ha? T.d. testing av stavekontrollen?

albbas commented 9 years ago

Comment 10037

Date: 2015-01-30 13:22:32 +0100 From: Lene Antonsen <>

(In reply to comment #6)

Fra gamle testamentet, to superlativer med Px: boarráseamos og nuoramus 5 44:12 Dállodoalli ohcagođii, ja son álggii boarrásepmosis ja loahpahii nuoramusas, ja juhkanlihtti gávdnui Benjamina seahkas .

Når jeg leser denne setninga på nytt igjen, ser jeg at selv om formene kan tolkes som Px former, så er det i denne setninga sannsynligvis lokativ. Den norske teksten har 'hos den eldste' og 'hos den yngste'.

albbas commented 9 years ago

Comment 10094

Date: 2015-02-09 17:59:58 +0100 From: Lene Antonsen <>

Jeg lukker denne buggen. Nå har vi et system i adjektivfila med å flytte adjektiver som vi finner ut skal ha Px opp i riktig leksikon.

albbas commented 8 years ago

Comment 11380

Date: 2016-07-25 15:57:26 +0200 From: Linda Wiechetek <>

(In reply to Lene Antonsen from comment #17)

Jeg lukker denne buggen. Nå har vi et system i adjektivfila med å flytte adjektiver som vi finner ut skal ha Px opp i riktig leksikon.

Er det forresten flest adjektiver som nå får Sem/Hum taggen?