apertium / apertium-spa-cat

Apertium translation pair for Spanish and Catalan
GNU General Public License v2.0
6 stars 4 forks source link

todo lo ADJ que -> tan ADJ com / ... (spa->cat) #29

Open jordimas opened 2 years ago

jordimas commented 2 years ago

La investigación no fue todo lo clara que se esperaba -> La recerca no va ser tot el clara que s'esperava

Aquí "el" és incorrecte.

jaumeortola commented 2 years ago

Si volem fer "todo lo clara que" > "tan clara com", suposo que caldria fer una regla en el fitxer .t1x. Això és molt incòmode. M'estimo més fer-ho en LRX, però tampoc és massa net. Com ho veus, @MarcRiera?

marcriera commented 2 years ago

Això correspon al T1X, sí. No és una regla especialment complexa, ho preparo.

marcriera commented 2 years ago

Resolt a https://github.com/apertium/apertium-spa-cat/commit/3e5ed123baee0801fe49dea83244d032eebeffa2

jaumeortola commented 2 years ago

Gràcies, Marc. Això funcionarà bé en un percentatge elevat de casos. Però m'imagino possibles problemes:

todo lo nuevo que escribía procura que todo lo bueno que hay en tu corazón

todo lo mejor que han podido

Per això deia que el T1X és poc flexible per a segons quines coses, sobretot per a tractar amb el context.

marcriera commented 2 years ago

Mirem en els tests si hi ha gaire canvis a pitjor i pensem si cal revertir-ho. Tots els casos problemàtics que esmentes tenen difícil solució.

Penso que ens hem de plantejar seriosament fer el canvi a apertium-recursive (hi ha feina començada a la branca https://github.com/apertium/apertium-spa-cat/tree/recursive-spa-cat). Tot i que el format de les regles és completament diferent i a vegades costa d'entendre, permet aplicar les regles més d'una vegada i fer la traducció per capes. En aquest cas en concret, tindríem tot el context davant i darrere i podríem resoldre la concordança.

jaumeortola commented 2 years ago

Sí, mirem què passa en els tests. No crec que calgui revertir-ho. Sí que caldrà a afegir altres solucions per a casos específics, per exemple: todo lo bueno > totes les coses bones

jaumeortola commented 2 years ago

@MarcRiera Com es veu en els tests, hi ha una mica de tot. A vegades depèn del verb que va abans o després. Serà laboriós arreglar la majoria de casos. En LRX es podria anar fent (lo > el/tant/les coses... ; que>que/com...; 'remove' en algun cas...). Segurament no és la manera "canònica" de fer-ho, però mentre no tinguem l'apertium-recursice és una possibilitat.