giellalt / lang-sme

Finite state and Constraint Grammar based analysers and proofing tools, and language resources for the Northern Sami language
https://giellalt.uit.no
GNU General Public License v3.0
6 stars 1 forks source link

Er b. en transitiv eller intransitiv forkortelse? ( #353

Closed albbas closed 12 years ago

albbas commented 12 years ago

This issue was created automatically with bugzilla2github

Bugzilla Bug 1225

Date: 2011-12-16T15:09:36+01:00 From: Berit Nystad Eskonsipo <> To: Thomas Omma <> CC: berit.a.baal, berit.nystad.eskonsipo, lene.antonsen, sjur.n.moshagen, trond.trosterud

Last updated: 2012-02-07T09:25:18+01:00

albbas commented 12 years ago

Comment 5477

Date: 2011-12-16 15:09:36 +0100 From: Berit Nystad Eskonsipo <>

Er b. en transitiv eller intransitiv forkortelse?

I dag er den registrert som en transitiv forkorelse i abbr-sme-lex.txt. I de fleste tilfellene stemmer dette, feks:

samediggi-article-3359.html.tmx.html:

Ođđajagimánu 12. b. 2010 lei Haitis garraseamos eanandoarggástus čuođi jahkái . Doarggástus mihtiduvvui 7,3 Richtera skálás ja guđii riikka heahtedillái .

MEN når en setning slutter med b.-forkortelsen, får verktøyene våre på ett eller annet nivå trøbbel, se feks på dette:

FØR MANUELL REDIGERING: freecorpus/prestable/tmx/orig/nob2sme/admin/sd/samediggi.no/samediggi-article-3359.html.tmx

Sámediggeráđi lahttu Ellinor Marita Jåma oaččui gutni rahpat duodje-čájáhusa maid Sámi allaskuvla ja Saemien Sijte lágidedje geassemánu 3. b. Čájáhus Saemien Sijtes Snoasas lei studeanttaid eksamenčájáhus kurssas Duodjijamáttasámegiella / giellageavaheapmi duojis Sámi allaskuvllas .

ETTER MANUELL REDIGERING: freecorpus/prestable/tmx/nob2sme/admin/sd/samediggi.no/samediggi-article-3359.html.tmx

Sametingsråd Ellinor Marita Jåma fikk æren av å åpne duodji-utstillingen i regi av Samisk Høgskole og Saemien Sijte torsdag 3. juni . Sámediggeráđi lahttu Ellinor Marita Jåma oaččui gutni rahpat duodje-čájáhusa maid Sámi allaskuvla ja Saemien Sijte lágidedje geassemánu 3. b. . Utstillingen på Saemien Sijte på Snåsa er eksamensutstillingen til studentene på kurset Duodji og sørsamisk språk / språkanvending i duodji ved Samisk Høgskole . Čájáhus Saemien Sijtes Snoasas lei studeanttaid eksamenčájáhus kurssas Duodjijamáttasámegiella / giellageavaheapmi duojis Sámi allaskuvllas . Hvordan skal vi unngå slike tilfeller i framtiden? Ha en fin helg :-)
albbas commented 12 years ago

Comment 5478

Date: 2011-12-17 14:55:11 +0100 From: Trond Trosterud <>

Mitt framlegg:

  1. Undersøke mange tilfelle av "b." og sjå kva som er best.
  2. evt. endre b. fra TRAB til TRNUMAB

Det er ikkje lett. Som samisk b. = beaivi er det nok TRNUMAB, men i andre tilfelle er det verre å avgjere).

(setningsgrense markert med ekstra punktum:)

TRAB: Odne lea juovlamánu 17. b. 2011. . Lea lávvordat. Odne lea juovlamánu 17. b. Lea lávvordat. a. Buorre b. Bahá

NUMTRAB: Odne lea juovlamánu 17. b. 2011. . Lea lávvordat. Odne lea juovlamánu 17. b. . Lea lávvordat. a. . Buorre b. . Bahá

ITRAB: Odne lea juovlamánu 17. b. . 2011. . Lea lávvordat. Odne lea juovlamánu 17. b. . Lea lávvordat. a. . Buorre b. . Bahá

Transitiv foran numeral vil vi ha. (17. b. 2011 i ei setning). Eg vil tru intransitiv foran stor bokstav er det beste (TRNUMAB for b. altså). Dei andre småbokstavane er eg ikkje sikker på.

albbas commented 12 years ago

Comment 5732

Date: 2012-02-06 20:55:43 +0100 From: Trond Trosterud <>

No har vi spesialbehandling av b. som intransitiv, dvs. som TRNUMAB:

~/main/gt/sme$echo "b. 1234 a. Buorre b. Bahá. geassemánu 3. b. Dat lei buorre." | preprocess --abbr=bin/abbr.txt b. 1234 a. Buorre b. . Bahá . geassemánu 3. b. . Dat lei buorre .

Korpusstudium viser at det er den beste løysinga.

Lukke?