giellalt / lang-sme

Finite state and Constraint Grammar based analysers and proofing tools, and language resources for the Northern Sami language
https://giellalt.uit.no
GNU General Public License v3.0
6 stars 1 forks source link

ikkje konsekvent i merking av arabiske vs. romerske tall ( #322

Open albbas opened 4 years ago

albbas commented 4 years ago

This issue was created automatically with bugzilla2github

Bugzilla Bug 2632

Date: 2019-10-31T11:11:46+01:00 From: Linda Wiechetek <> To: Thomas Omma <> CC: lene.antonsen, linda.wiechetek, sjur.n.moshagen, trond.trosterud

Last updated: 2019-10-31T12:03:07+01:00

albbas commented 4 years ago

Comment 13794

Date: 2019-10-31 11:11:46 +0100 From: Linda Wiechetek <>

Æ så litt på forskjellige tagger og har lagt merke til at vi ikkje er konsekvente i dette tilfellet. Arabiske tall får Arab taggen, men ikkje når dem er Ord. Men romerske tall får Rom taggen i begge tilfeller (både kardinal- og ordinal).

Er det ment sånn eller burde vi være konsekvente her?

1.

  1. 1+A+Ord+Attr

1 1 1+Num+Arab+Sg+Loc+Attr 1 1+Num+Arab+Sg+Ill+Attr 1 1+Num+Arab+Sg+Nom 1 1+Num+Arab+Sg+Gen 1 1+Num+Arab+Sg+Acc

I. I. i+N+ABBR+Attr I. i+N+ABBR+Sg+Nom I. i+N+ABBR+Sg+Gen I. i+N+ABBR+Sg+Acc I. I+N+ABBR+Attr I. I+N+ABBR+Sg+Nom I. I+N+ABBR+Sg+Gen I. I+N+ABBR+Sg+Acc I. I+A+Rom+Ord+Sg

I I i+N+ABBR+Attr I i+N+ABBR+Sg+Nom I i+N+ABBR+Sg+Gen I i+N+ABBR+Sg+Acc I I+A+Rom+Ord+Sg I I+Num+Rom+Sg+Nom

albbas commented 4 years ago

Comment 13795

Date: 2019-10-31 11:43:34 +0100 From: Lene Antonsen <>

Hvilken analysator bruker du?

Jeg får slikt resultat: husmedis 3.

  1. 3+A+Arab+Ord+Attr 0,000000

^C svhum-hsl-m0283:~ lan000$ husme 1.

  1. 1+A+Arab+Ord+Attr 0,000000
albbas commented 4 years ago

Comment 13796

Date: 2019-10-31 11:52:05 +0100 From: Thomas Omma <>

I. I+Num+Rom 0,000000 I I+Num+Rom+Sg+Nom 0,000000

  1. 3+A+Arab+Ord+Attr 0,000000

3 3+Num 0,000000 3 3+Num+Arab+Sg+Acc 0,000000 3 3+Num+Arab+Sg+Gen 0,000000 3 3+Num+Arab+Sg+Ill+Attr 0,000000 3 3+Num+Arab+Sg+Loc+Attr 0,000000 3 3+Num+Arab+Sg+Nom 0,000000

albbas commented 4 years ago

Comment 13797

Date: 2019-10-31 12:03:07 +0100 From: Lene Antonsen <>

Ved å bruke -dis analysator, blir det slik: husmedis 3 3 3+Num+Arab+Sg+Acc 0,000000 3 3+Num+Arab+Sg+Gen 0,000000 3 3+Num+Arab+Sg+Ill+Attr 0,000000 3 3+Num+Arab+Sg+Loc+Attr 0,000000 3 3+Num+Arab+Sg+Nom 0,000000 3 3+Num+Sem/ID 0,000000

Dvs si at arabics kan analyseres som +Num+Arab og som 3+Num+Sem/ID, dvs. at numeralet ikke kvantifiserer.

Nedenfor her: 41 021 011 kan være et tall som kvantifiserers, de andre variantene ikke, dvs at de er telefonnummer eller lign.

41021011 41021011 41021011+Num+Sem/ID 0,000000

41 021 011 41 021 011 41 021 011+Num+Arab+Sg+Acc 0,000000 41 021 011 41 021 011+Num+Arab+Sg+Gen 0,000000 41 021 011 41 021 011+Num+Arab+Sg+Ill+Attr 0,000000 41 021 011 41 021 011+Num+Arab+Sg+Loc+Attr 0,000000 41 021 011 41 021 011+Num+Arab+Sg+Nom 0,000000 41 021 011 41 021 011+Num+Sem/ID 0,000000

410 210 11 410 210 11 410 210 11+Num+Sem/ID 0,000000