Closed albbas closed 4 years ago
Date: 2020-09-10 18:03:37 +0200
From: Lene Antonsen <
add_stemtype2xml.py må forbedres, den skal bruke + som høyregrense, ikke mellomrom. Problemet er at den f.eks. gir info om at 'politiija' er kontrakt stamme, riktig er likestavelses stamme. Grunnen er sannsynligvis at vi ha en slik oppføring i nouns.lexc: politiija ALLGUOVT ;
som blir registrert framfor denne: politiija+N+CmpN/SgN+CmpN/SgG+CmpN/PlG+Sem/Group_Hum:politi IIJA ;
som vil gi likestavelsesstamme.
I nouns og adjektiv vil alle stammene ha + som høyregrense, så også : kan fjernes fra skriptet
Date: 2020-09-14 10:04:49 +0200
From: Chiara Argese <
Grunnen at skriptet bruker mellomrom som høyregrense er at fra
da får man ALLGUOVT og IIJA som kan matches med lister i nouns_stemtypes.txt. Men den stopper til første treff (1.) Er det slik at hvis det finnes 2 muligheter bør man bruke linje som inneholder + (2.) istedet for den som ikke har + (1.)?
Date: 2020-09-14 10:19:42 +0200
From: Lene Antonsen <
Det skal være slik: I nouns og adjektiv og propernouns skal alle stammene ha '+' som høyregrense, dvs at hverken mellomrom eller : skal være grense. For verb er det ':'
Date: 2020-09-14 10:37:47 +0200
From: Chiara Argese <
Man kan ikke bruke bare + som grense, man må bruke mellomrom for å få stammetype. Ved å bruke + som grense får man sånne deler: politiija N CmpN/SgN CmpN/SgG CmpN/PlG Sem/Group_Hum:politi IIJA ;
IIJA får man bare hvis man bruker mellomrom som grense.
Derfor spurte jeg hvis grunnen at politiija ALLGUOVT ; må ikke brukes fordi at den ikke inneholder +
Date: 2020-09-14 11:22:33 +0200
From: Lene Antonsen <
Jeg ser nå at vi tenker to forkjellige ting, jeg mente for å finne lemmaet så må + være høyregrense, dvs hvordan man 'kjenner igjen' lemmaet. Men vi kan se på dette sammen
Date: 2020-09-14 13:39:47 +0200
From: Chiara Argese <
Nå politiija er fikset og vises med likestavelses stamme.
This issue was created automatically with bugzilla2github
Bugzilla Bug 2677
Date: 2020-09-10T18:03:37+02:00 From: Lene Antonsen <>
To: Chiara Argese <>
CC: berit.nystad.eskonsipo, sjur.n.moshagen, trond.trosterud
Last updated: 2020-09-14T13:39:47+02:00