Closed albbas closed 10 years ago
Date: 2013-04-11 23:57:17 +0200
From: Ryan Johnson <
Hei!
One of the things I notice when I flip back and forth, testing between sanit, sanat, baakoeh, valks, vada, etc., is that there may be different things that should be shown to users for each language, for example, South Sámi might like to have verb class (which is listed as an attribute in
So, my question is: for each language (including nob, rus, etc.), what information do we want to show in the list of entries in search results for both the source language and the target languages? For example: in the XML file, we also have access to Norwegian declension information, and gender information:
<tg>
<t decl="a1" pos="a">trang</t>
</tg>
<lg>
<l pos="n">airo</l>
<stem>airro</stem>
</lg>
<mg>
<tg>
<t pos="n" decl="f">åre i båt</t>
</tg>
</mg>
Thus, we could show something like:
ahdas (a)
- trang (a. a1)
airo (n. airro-)
- åre i båt (n. f.)
In any case, there is an easy way to implement this on a language specific means without making the python code too difficult to understand, or too language specific... But, I thought it would be good to collect a list of what is needed for each language.
Date: 2013-10-16 09:49:59 +0200
From: Lene Antonsen <
Sørsamisk bør vise verbklasse, men idag er det litt kryptisk: eks: vaedtsedh (v., i) mïnnedh (v., iv) Jeg forslår å bruke store bokstaver: i => I iv => IV
For alle språk: Ordklasse er bra å ha med, men det bør skrives helt ut også i sørsamisk (se hvordan det er i nordsamisk): s. => subst. v. => verb
osv.
Kan PoS-informasjonen lokaliseres?
Date: 2013-10-16 10:56:46 +0200
From: Trond Trosterud <
Ja, det kan den, det er ei fil for det, i configs-mappa. Vi ser på det i lag.
Date: 2013-10-16 12:00:38 +0200
From: Lene Antonsen <
(In reply to comment #2)
Ja, det kan den, det er ei fil for det, i configs-mappa. Vi ser på det i lag.
Jeg fant filene og har begynt arbeidet. Det må også gjøres for sme-fin, men der foreslår jeg at Trond gjør det, pga finsken.
Date: 2013-10-16 16:58:24 +0200
From: Lene Antonsen <
Jeg har endra en god del i sanit.config.yaml.in, og kopiert over i baakoeh.config.yaml.in. Jeg skal prøve å kompilere på gtoahpa-serveren.
Date: 2013-10-16 22:38:51 +0200
From: Ryan Johnson <
Kult!
Eg måtte gjera nokre oppdateringar for å fiksa problemet du fann i kompileringa, men no burde alt vera oppdatert, og kompileringsprosess fungerar att. Prøv sjølv, slik at me er sikkre på at det fungerar for alle. :)
Date: 2013-10-16 23:57:09 +0200
From: Lene Antonsen <
Det gikk bra å kompilere på serveren, og jeg fikk det meste til. Men jeg savner enda verbklasseinfo i baakoeh. Prøvde slik:
i: "I"
ii: "II"
iii: "III"
iv: "IV"
v: "V"
vi: "VI"
Men det fungerte ikke.
Date: 2013-10-17 23:04:11 +0200
From: Lene Antonsen <
i: "I" ii: "II" iii: "III" iv: "IV" v: "V" vi: "VI"
Ryan gjorde noen endringer for at yaml-fila skal fungere også på tagger fra xml-fila, ikke bare FST, så nå fungerer disse også.
Date: 2013-10-17 23:23:26 +0200
From: Lene Antonsen <
Jeg nedgraderer prioriteringa av denne, fordi det viktigste er gjort. Jeg overlater til Trond å se på hva som bør være med av info om nob.
Date: 2014-01-08 00:00:22 +0100
From: Ryan Johnson <
Hei,
Trur me kan lukke buggen no. Som du sa, det viktigste er gjort, nokon kan opna andre bugger viss noko ikkje fungerar som det skal. :)
This issue was created automatically with bugzilla2github
Bugzilla Bug 1648
Date: 2013-04-11T23:57:17+02:00 From: Ryan Johnson <>
To: Ryan Johnson <>
CC: berit.nystad.eskonsipo, ciprian.gerstenberger, lene.antonsen, marja.eira, trond.trosterud
Last updated: 2014-01-08T00:00:22+01:00