giellalt / bugzilla-dummy

0 stars 0 forks source link

Lexical information for presentation to users in NDS (Bugzilla Bug 1648) #1999

Closed albbas closed 10 years ago

albbas commented 11 years ago

This issue was created automatically with bugzilla2github

Bugzilla Bug 1648

Date: 2013-04-11T23:57:17+02:00 From: Ryan Johnson <> To: Ryan Johnson <> CC: berit.nystad.eskonsipo, ciprian.gerstenberger, lene.antonsen, marja.eira, trond.trosterud

Last updated: 2014-01-08T00:00:22+01:00

albbas commented 11 years ago

Comment 8140

Date: 2013-04-11 23:57:17 +0200 From: Ryan Johnson <>

Hei!

One of the things I notice when I flip back and forth, testing between sanit, sanat, baakoeh, valks, vada, etc., is that there may be different things that should be shown to users for each language, for example, South Sámi might like to have verb class (which is listed as an attribute in nodes), while North Sámi may just need part of speech, though maybe learners might also like to see gradation pair information, or something like that.

So, my question is: for each language (including nob, rus, etc.), what information do we want to show in the list of entries in search results for both the source language and the target languages? For example: in the XML file, we also have access to Norwegian declension information, and gender information:

   <tg>
      <t decl="a1" pos="a">trang</t>
   </tg>

  <lg>
     <l pos="n">airo</l>
     <stem>airro</stem>
  </lg>
  <mg>
     <tg>
        <t pos="n" decl="f">åre i båt</t>
     </tg>
  </mg>

Thus, we could show something like:

ahdas (a) 
  - trang (a. a1)

airo (n. airro-)
  - åre i båt (n. f.)

In any case, there is an easy way to implement this on a language specific means without making the python code too difficult to understand, or too language specific... But, I thought it would be good to collect a list of what is needed for each language.

albbas commented 11 years ago

Comment 8577

Date: 2013-10-16 09:49:59 +0200 From: Lene Antonsen <>

Sørsamisk bør vise verbklasse, men idag er det litt kryptisk: eks: vaedtsedh (v., i) mïnnedh (v., iv) Jeg forslår å bruke store bokstaver: i => I iv => IV

For alle språk: Ordklasse er bra å ha med, men det bør skrives helt ut også i sørsamisk (se hvordan det er i nordsamisk): s. => subst. v. => verb

osv.

Kan PoS-informasjonen lokaliseres?

albbas commented 11 years ago

Comment 8585

Date: 2013-10-16 10:56:46 +0200 From: Trond Trosterud <>

Ja, det kan den, det er ei fil for det, i configs-mappa. Vi ser på det i lag.

albbas commented 11 years ago

Comment 8590

Date: 2013-10-16 12:00:38 +0200 From: Lene Antonsen <>

(In reply to comment #2)

Ja, det kan den, det er ei fil for det, i configs-mappa. Vi ser på det i lag.

Jeg fant filene og har begynt arbeidet. Det må også gjøres for sme-fin, men der foreslår jeg at Trond gjør det, pga finsken.

albbas commented 11 years ago

Comment 8593

Date: 2013-10-16 16:58:24 +0200 From: Lene Antonsen <>

Jeg har endra en god del i sanit.config.yaml.in, og kopiert over i baakoeh.config.yaml.in. Jeg skal prøve å kompilere på gtoahpa-serveren.

albbas commented 11 years ago

Comment 8597

Date: 2013-10-16 22:38:51 +0200 From: Ryan Johnson <>

Kult!

Eg måtte gjera nokre oppdateringar for å fiksa problemet du fann i kompileringa, men no burde alt vera oppdatert, og kompileringsprosess fungerar att. Prøv sjølv, slik at me er sikkre på at det fungerar for alle. :)

albbas commented 11 years ago

Comment 8598

Date: 2013-10-16 23:57:09 +0200 From: Lene Antonsen <>

Det gikk bra å kompilere på serveren, og jeg fikk det meste til. Men jeg savner enda verbklasseinfo i baakoeh. Prøvde slik:

i: "I"
ii: "II"
iii: "III"
iv: "IV"
v: "V"
vi: "VI"

Men det fungerte ikke.

albbas commented 11 years ago

Comment 8608

Date: 2013-10-17 23:04:11 +0200 From: Lene Antonsen <>

i: "I"
ii: "II"
iii: "III"
iv: "IV"
v: "V"
vi: "VI"

Ryan gjorde noen endringer for at yaml-fila skal fungere også på tagger fra xml-fila, ikke bare FST, så nå fungerer disse også.

albbas commented 11 years ago

Comment 8610

Date: 2013-10-17 23:23:26 +0200 From: Lene Antonsen <>

Jeg nedgraderer prioriteringa av denne, fordi det viktigste er gjort. Jeg overlater til Trond å se på hva som bør være med av info om nob.

albbas commented 10 years ago

Comment 8848

Date: 2014-01-08 00:00:22 +0100 From: Ryan Johnson <>

Hei,

Trur me kan lukke buggen no. Som du sa, det viktigste er gjort, nokon kan opna andre bugger viss noko ikkje fungerar som det skal. :)