giellalt / bugzilla-dummy

0 stars 0 forks source link

Sem-taggar utan +Sem/ -prefiks (Bugzilla Bug 1877) #1450

Closed albbas closed 9 years ago

albbas commented 10 years ago

This issue was created automatically with bugzilla2github

Bugzilla Bug 1877

Date: 2014-06-30T16:25:07+02:00 From: Sjur Nørstebø Moshagen <> To: Børre Gaup <> CC: sjur.n.moshagen, trond.trosterud

Last updated: 2015-03-04T12:05:45+01:00

albbas commented 10 years ago

Comment 9516

Date: 2014-06-30 16:25:07 +0200 From: Sjur Nørstebø Moshagen <>

Jamfør desse to:

$ grep -l 'Sem/Plc' */src/morphology/root.lexc|cut -d"/" -f1|tr '\n' ' ' fao kpv liv mdf mrj myv sma sme smj smn vot

$ grep -l '+Plc' */src/morphology/root.lexc|cut -d"/" -f1|tr '\n' ' ' izh kca lut mhr mns nio nob olo rup sjd sje smj smn sms som tat udm vep vro yrk

Børre, kan du leggja til "+Sem/" (utan hermeteikn) på i alle fall desse taggane:

+Plc +Msc +Fem +Sur +Obj +Org

albbas commented 10 years ago

Comment 9518

Date: 2014-06-30 23:59:47 +0200 From: Trond Trosterud <>

Det gjeld altså alle sem-taggar i alle lexc-filer.

albbas commented 10 years ago

Comment 9522

Date: 2014-07-07 12:13:31 +0200 From: Børre Gaup <>

Skal dette gjøres bare i root.lexc eller i alle filer?

Er for eksempel denne endringen fra smj/src/morphology/affixes/propernouns.lexc ok?

albbas commented 10 years ago

Comment 9523

Date: 2014-07-07 12:48:15 +0200 From: Børre Gaup <>

En annen ting er +Sem/Fem

Fra sme: sme/src/morphology/root.lexc: +Sem/Fem !!= * @CODE@ = Female name

Fra rus: rus/src/morphology/root.lexc:+Sem/Msc +Sem/Fem +Neu +MFN !!= * @CODE@ = grammatical gender, +MFN = gender unspecifiable (pl tantum)

Er det riktig å bruke +Sem/Fem i begge tilfellene?

albbas commented 10 years ago

Comment 9525

Date: 2014-07-08 10:52:36 +0200 From: Trond Trosterud <>

Nei, dette er feil.

Det skal vere +Msc +Fem +Neu for genus i russisk, norsk, ... +Sem/Mal +Sem/Fem for t.d. menn og kvinner

I og med at vi no har +Sem/... er taggane ikkje lenger identisk, men det kan gje opphav til forvirring.

Det som tydelegvis har skjedd er at eit for ivrig script har overfört alle +Fem til +Sem/Fem, ikkje berre kvinnenemn, men også ord som lue, gås, лампа, книга. (desse siste skal altså vere +Fem).

albbas commented 10 years ago

Comment 9526

Date: 2014-07-08 12:30:07 +0200 From: Børre Gaup <>

Jeg har gjort søk-og-erstatt i en separat grein på min egen maskin, så rus og nob (f.eks.) har fremdeles bare +Fem i svn.

Men, for å unngå +Fem <-> +Sem/Fem forvirring kunne man kanskje forandre det som er +Sem/Fem nå +Prop/Fem og bruke +Prop/Fem i alle språk? Eller blir det også feil?

albbas commented 10 years ago

Comment 9527

Date: 2014-07-08 19:29:11 +0200 From: Sjur Nørstebø Moshagen <>

(In reply to comment #5)

Jeg har gjort søk-og-erstatt i en separat grein på min egen maskin, så rus og nob (f.eks.) har fremdeles bare +Fem i svn.

Ok.

Men, for å unngå +Fem <-> +Sem/Fem forvirring kunne man kanskje forandre det som er +Sem/Fem nå +Prop/Fem og bruke +Prop/Fem i alle språk? Eller blir det også feil?

Ja. Forvirringa har vi berre no så lenge vi ikkje skil mellom grammatisk kjønn (som i nob, rus og fao) og semantisk kjønn (dvs klassa av ord som fungerer syntaktisk m.m. likt med ord som 'dame', 'jente' osb.). Det fyrste styrer bøying av omkringliggjande ord (hokjønnsord på færøysk/bokmål/russisk skal ha artikkel i hokjønnsform, osb.), medan det siste kan brukast i t.d. ein grammatikkontroll for å identifisera visse typar nominalfrasar sjølv om det er bøyingsfeil eller andre feil i setninga. Grammatisk kjønn er det berre visse språk som har, semantisk kjønn slik vi nyttar det her finst i alle språk (uttrykket 'semantisk kjønn' er noko eg berre laga meg her og no for diskusjonen sin del).

+Prop er noko anna, og skal ikkje blandast inn i diskusjonen (det er ei underordklasse av substantiv).

Altså: ikkje rør grammatisk kjønn (+Fem m.m. i rus/nob/fao), alle andre +Fem skal bli +Sem/Fem. Det same gjeld Msc (for maskulin).

albbas commented 9 years ago

Comment 10236

Date: 2015-02-23 23:15:18 +0100 From: Sjur Nørstebø Moshagen <>

Denne saka er vel ferdig og avslutta?

albbas commented 9 years ago

Comment 10248

Date: 2015-02-24 16:08:01 +0100 From: Børre Gaup <>

(In reply to comment #7)

Denne saka er vel ferdig og avslutta?

Nei, arbeidet stoppet opp når det ble krøll med +Fem og +Msc. Ser på det igjen nå.

albbas commented 9 years ago

Comment 10251

Date: 2015-02-24 19:34:50 +0100 From: Børre Gaup <>

Da er +X -> +Sem/X gjennomført i commit 108148 - 108168

Det er en commit per tag.

albbas commented 9 years ago

Comment 10301

Date: 2015-03-04 12:05:45 +0100 From: Børre Gaup <>

Lukker denne siden den tydeligvis ikke har forstyrret byggingen av språkene.