giellalt / lang-smj

Finite state and Constraint Grammar based analysers and proofing tools + language resources for Lule Sámi
https://giellalt.uit.no
GNU General Public License v3.0
2 stars 0 forks source link

TTS: Legg til rett tekst for ulike symbol #30

Open snomos opened 1 year ago

snomos commented 1 year ago

I fila src/transcriptions/transcriptor-abbrevs2text.lexc er det mange symbol som berre har ein dummy-tekst, t.d. desse:

https://github.com/giellalt/lang-smj/blob/ccf2697f500f6acc1074b269f546d2cc3592bad7/src/transcriptions/transcriptor-abbrevs2text.lexc#L594-L620

Vi treng riktig tekst på alle slik at vi kan lesa dei rett når dei dukkar opp i teksten.

Nokre er kanskje ikkje så viktige, dei må i så fall kommenterast ut, så kan vi ta dei etter kvart som vi kjem over dei.

ilm024 commented 1 year ago

Jeg har null idé på hva vi skal kalle disse symbolene på lulesamisk. Alt jeg vet har jeg skrevet, så det beste er nok å utkommentere og sende til GG?

snomos commented 1 year ago

Ok, eg er berre redd det vil ta lang tid. Men det er sikkert best å gjera det. Kan du senda lista til GG?

snomos commented 1 year ago

Då har eg kommentert ut:

https://github.com/giellalt/lang-smj/blob/7975908d131ea808279fd2f0fa61ff0445e5c9a3/src/transcriptions/transcriptor-abbrevs2text.lexc#L594-L607

Men kva med desse? Her treng ein ikkje GG, det viktigaste er kva du synest er mest naturleg å få opplese når ulike smilefjes dukkar opp i ein tekst:

https://github.com/giellalt/lang-smj/blob/7975908d131ea808279fd2f0fa61ff0445e5c9a3/src/transcriptions/transcriptor-abbrevs2text.lexc#L610-L620

ilm024 commented 1 year ago

Æ veit ikkje heilt ka vi ska kall de heller.

flammie commented 1 year ago

ä har eksperimentert lit med ordprediksjon og transkripsjon av emoji, kanskje denne cldr-listor i anna språk kan vara nyttig? unicode folk har tenkt at denne blir brukt akkurat med tts og mobiltastatur: https://github.com/unicode-org/cldr/blob/latest/common/annotations/fi.xml

ilm024 commented 3 weeks ago

@snomos, skal jeg bare kopiere inn lista fra Flammie og ta fatt på oversetting?