giellalt / bugzilla-dummy

0 stars 0 forks source link

add_stemtype2xml.py må forbedres (Bugzilla Bug 2677) #1891

Closed albbas closed 4 years ago

albbas commented 4 years ago

This issue was created automatically with bugzilla2github

Bugzilla Bug 2677

Date: 2020-09-10T18:03:37+02:00 From: Lene Antonsen <> To: Chiara Argese <> CC: berit.nystad.eskonsipo, sjur.n.moshagen, trond.trosterud

Last updated: 2020-09-14T13:39:47+02:00

albbas commented 4 years ago

Comment 13981

Date: 2020-09-10 18:03:37 +0200 From: Lene Antonsen <>

add_stemtype2xml.py må forbedres, den skal bruke + som høyregrense, ikke mellomrom. Problemet er at den f.eks. gir info om at 'politiija' er kontrakt stamme, riktig er likestavelses stamme. Grunnen er sannsynligvis at vi ha en slik oppføring i nouns.lexc: politiija ALLGUOVT ;

som blir registrert framfor denne: politiija+N+CmpN/SgN+CmpN/SgG+CmpN/PlG+Sem/Group_Hum:politi IIJA ;

som vil gi likestavelsesstamme.

I nouns og adjektiv vil alle stammene ha + som høyregrense, så også : kan fjernes fra skriptet

albbas commented 4 years ago

Comment 13984

Date: 2020-09-14 10:04:49 +0200 From: Chiara Argese <>

Grunnen at skriptet bruker mellomrom som høyregrense er at fra

  1. politiija ALLGUOVT ;
  2. politiija+N+CmpN/SgN+CmpN/SgG+CmpN/PlG+Sem/Group_Hum:politi IIJA ;

da får man ALLGUOVT og IIJA som kan matches med lister i nouns_stemtypes.txt. Men den stopper til første treff (1.) Er det slik at hvis det finnes 2 muligheter bør man bruke linje som inneholder + (2.) istedet for den som ikke har + (1.)?

albbas commented 4 years ago

Comment 13985

Date: 2020-09-14 10:19:42 +0200 From: Lene Antonsen <>

Det skal være slik: I nouns og adjektiv og propernouns skal alle stammene ha '+' som høyregrense, dvs at hverken mellomrom eller : skal være grense. For verb er det ':'

albbas commented 4 years ago

Comment 13986

Date: 2020-09-14 10:37:47 +0200 From: Chiara Argese <>

Man kan ikke bruke bare + som grense, man må bruke mellomrom for å få stammetype. Ved å bruke + som grense får man sånne deler: politiija N CmpN/SgN CmpN/SgG CmpN/PlG Sem/Group_Hum:politi IIJA ;

IIJA får man bare hvis man bruker mellomrom som grense.

Derfor spurte jeg hvis grunnen at politiija ALLGUOVT ; må ikke brukes fordi at den ikke inneholder +

albbas commented 4 years ago

Comment 13987

Date: 2020-09-14 11:22:33 +0200 From: Lene Antonsen <>

Jeg ser nå at vi tenker to forkjellige ting, jeg mente for å finne lemmaet så må + være høyregrense, dvs hvordan man 'kjenner igjen' lemmaet. Men vi kan se på dette sammen

albbas commented 4 years ago

Comment 13988

Date: 2020-09-14 13:39:47 +0200 From: Chiara Argese <>

Nå politiija er fikset og vises med likestavelses stamme.