giellalt / lang-sme

Finite state and Constraint Grammar based analysers and proofing tools, and language resources for the Northern Sami language
https://giellalt.uit.no
GNU General Public License v3.0
6 stars 1 forks source link

Behandling av arabiske og romerske tall ( #273

Closed albbas closed 4 years ago

albbas commented 8 years ago

This issue was created automatically with bugzilla2github

Bugzilla Bug 2171

Date: 2016-04-02T09:29:46+02:00 From: Lene Antonsen <> To: Thomas Omma <> CC: lene.antonsen, linda.wiechetek, sandra.rahka, sjur.n.moshagen, trond.trosterud

Last updated: 2020-05-04T13:32:34+02:00

albbas commented 8 years ago

Comment 11285

Date: 2016-04-02 09:29:46 +0200 From: Lene Antonsen <>

Vi burde ha en tagg som forteller at numeralet er arabic, f.eks. +Arab

Det første eksempelet her får feil disambiguering, men det er vanskelig å gjøre noe med det så lenge det er samme tagger for 2 og guovtti.

"<Álgogursa>" "álgokursa" N Sem/Edu Sg Nom "<2>" "2" Num Sg Loc Attr <======== skulle vært "2" Num Sg Nom "<sámegielas>" "sámegiella" N Sem/Lang Sg Loc

"<Álgogursa>" "álgokursa" N Sem/Edu Sg Nom "" "guokte" Num Sg Loc Attr "<sámegielas>" "sámegiella" N Sem/Lang Sg Loc

albbas commented 8 years ago

Comment 11289

Date: 2016-04-04 09:00:47 +0200 From: Thomas Omma <>

+Arab is a good tag

we can also try to have fun and take +sáttosnáhpot, maybe in a shorter version +sátsnáhp eller nåt liknande

albbas commented 8 years ago

Comment 11303

Date: 2016-04-18 16:37:10 +0200 From: Lene Antonsen <>

sme$ svn ci -m "La til +Arab til arabiske tall, se bz. 2171." src/morphology/root.lexc src/morphology/stems/numerals.lexc Sending src/morphology/root.lexc Sending src/morphology/stems/numerals.lexc Transmitting file data .. Committed revision 132541.

albbas commented 8 years ago

Comment 11304

Date: 2016-04-19 08:34:29 +0200 From: Lene Antonsen <>

Enn romerske tall:

IV Beavdegirjelasáhusat

Ka med +Rom som tagg?

albbas commented 8 years ago

Comment 11305

Date: 2016-04-19 08:35:51 +0200 From: Thomas Omma <>

jajaja +Rom is nice

albbas commented 8 years ago

Comment 11306

Date: 2016-04-19 08:37:19 +0200 From: Thomas Omma <>

(In reply to Thomas Omma from comment #4)

jajaja +Rom is nice

much better than +JuliusCeasar

albbas commented 8 years ago

Comment 11307

Date: 2016-04-19 08:43:47 +0200 From: Lene Antonsen <>

Det kan virke som flisespikkeri eller en vits, men dette er faktisk viktig for å få MT til å fungere.

III III III+Num+Sg+Acc <=== fjerne? III III+Num+Sg+Gen <=== fjerne? III III+Num+Sg+Nom III III+A+Ord III III+N+ACR+Sg+Acc <=== fjerne? III III+N+ACR+Sg+Gen <=== fjerne? III III+N+ACR+Sg+Nom <=== fjerne?

Jeg foreslår også å fjerne alle kasus bortsett fra +Sg+Nom fra romertallene (dvs at +Sg må legges til). Og selvfølgelig beholde +A+Ord for kongerekka. Finnes det eksempler på at romertallene skal ha andre kasus? I eksemplene som jeg har sett, er selve romertallet utafor setninga, som i IV Beavdegirjelasáhusat

eller som benevning på bind i en bokrekke: Schnitler III 1985: 159 eller for kongerrekka: Olav V

albbas commented 8 years ago

Comment 11308

Date: 2016-04-19 08:45:27 +0200 From: Lene Antonsen <>

III III III+Num+Sg+Acc <=== fjerne? III III+Num+Sg+Gen <=== fjerne? III III+Num+Sg+Nom

Glemte å kommentere at +Sg bare er i min maskin.

albbas commented 7 years ago

Comment 12199

Date: 2017-03-15 09:56:09 +0100 From: Lene Antonsen <>

Etter de siste endringene for acro er ståa no: III III III+A+Rom+Ord+Sg III III+Num+Rom+Sg+Nom III III+N+Prop+ACR+Dyn+Sg+Nom III III+N+Prop+ACR+Dyn+Sg+Gen III III+N+Prop+ACR+Dyn+Sg+Acc III III+N+ACR+Sg+Nom <== III III+N+ACR+Sg+Gen <== III III+N+ACR+Sg+Acc <==

Vi har no bare +Sg+Nom for +Rom, i tråd med mitt forslag Jeg foreslår å fjerne romertallene fra +ACR

albbas commented 7 years ago

Comment 12201

Date: 2017-03-15 11:06:17 +0100 From: Trond Trosterud <>

Eg er samd, og det bør vere ei smal sak for dei leksikaliserte romertala. (dei tre siste). Det er derimot verre for +Dyn for å få til det må vi spekulere ein del på regex. Så viss vi kan handsame +Dyn på eit anna vis gjer det ting lettare.

albbas commented 7 years ago

Comment 12203

Date: 2017-03-15 11:48:34 +0100 From: Lene Antonsen <>

(In reply to Trond Trosterud from comment #9)

Eg er samd, og det bør vere ei smal sak for dei leksikaliserte romertala. (dei tre siste). Det er derimot verre for +Dyn for å få til det må vi spekulere ein del på regex. Så viss vi kan handsame +Dyn på eit anna vis gjer det ting lettare.

+Dyn analysene kan vi disambiguere bort ved at leksikaliserte analyser går foran +Dyn.

albbas commented 4 years ago

Comment 13939

Date: 2020-05-04 13:32:34 +0200 From: Lene Antonsen <>

husme: III III III+N+Prop+Sem/Org+ACR+Dyn+Sg+Acc 0,000000 III III+N+Prop+Sem/Org+ACR+Dyn+Sg+Gen 0,000000 III III+N+Prop+Sem/Org+ACR+Dyn+Sg+Nom 0,000000 III III+N+Prop+Sem/Org+ACR+Sg+Acc 0,000000 III III+N+Prop+Sem/Org+ACR+Sg+Gen 0,000000 III III+N+Prop+Sem/Org+ACR+Sg+Nom 0,000000 III III+Num+Rom+Sg+Nom 0,000000

Denne er løst, jeg lukker