sbosio / rla-es

Recursos lingüísticos abiertos del español
Other
214 stars 48 forks source link

Update Adjetivos.txt #285

Closed Pompilos closed 11 months ago

Pompilos commented 1 year ago

Añado cómitre/S, dromomaníaco/GS, dromomaniaco/GS, gallonado/GS, iconográfico/GS, mesopotámico/GS, metanero/GS, monolingüe/S, posmoderno/GS, transoceánico/GS, trasoceánico/GS y trilingüe/S.

jorgesumle commented 1 year ago

Para «transoceánico» y «trasoceánico» lo mejor es simplemente añadir el código de prefijo u (trans-, tras-) a oceánico/SG, quedando así: oceánico/SGu.

RickieES commented 1 year ago

Hay varias cosas en este PR:

Al margen de lo anterior, también me pregunto si algunos de los términos que se han incluido en los últimos PR, como cómitre, dromomaníaco, facería, bricbarca o trirreme, son de uso habitual. ¿Utilizas estos lemas normalmente? Porque, si no es así, hay mejores lemas para añadir. :smile:

jorgesumle commented 1 year ago

cómitre y dromomaniaco/dromomaníaco son sustantivos, no adjetivos; al menos, no veo en el DLE ninguna acepción marcada como adjetivo.

Dromomaníaco sí es adjetivo, aunque se usa también como sustantivo:

  1. adj. Que padece dromomanía. Viajeros dromomaníacos. Apl. a pers., u. t. c. s.

¿Utilizas estos lemas normalmente? Porque, si no es así, hay mejores lemas para añadir. smile

Aunque no sean de uso muy habitual, son palabras que no deben ser marcadas como error, ya que están en el diccionario de la RAE.

Pompilos commented 1 year ago

Hola.

1) Cambio a hemorroidal/Sc como recomiendas. 2) Quito cómitre, que no es adjetivo. 3) dromomaníaco es adjetivo. 4) Yo mantendría gallo, porque en la aceptión 5 del DLE dicen «U. t. c. adj.» (Usado tmabién como adjetivo). 5) No sé cuál es el criterio que se ha acordado para incluir términos. Coincido con Jorge en que basta con que existan y estén el el DLE para incluirlos. Tal vez se usen poco, pero si he descubierto que no estaban es porque me han salido como error en textos que estaba leyendo o escribiendo. 6) ¿Hay mejores lemas? Seguro, alguien los descubrirá y añadirá. ;)

Un saludo.

RickieES commented 11 months ago

Semidesnudo se puede obtener añadiendo la bandera q a "desnudo", también en Adjetivos.txt:

desnudo/GSq

RickieES commented 11 months ago

También quiero comentar dos aspectos que han surgido anteriormente: cuándo añadir palabras al diccionario y en qué categoría.

Sobre cuándo añadir palabras al diccionario, no es realista pensar que podemos tener todos los lemas existentes en el diccionario, incluso si están admitidos por la RAE. En este sentido, el artículo del wiki Cómo colaborar con RLA-ES tiene un apartado sobre los criterios para admitir las palabras. Insisto, no podemos pensar que el diccionario va a poder albergar todos los lemas posibles de la RAE; pensad que, aunque nos apoyemos en banderas para derivar términos, en el fichero que realmente se usa por el motor del corrector ortográfico están todos los lemas expandidos.

En cuanto a con qué categoría añadir los lemas, de eso no hemos hablado nunca, es verdad, y deberíamos hacerlo. Para mí, cuando aparece la nota U.t.c.s. o similares, significa que la RAE no le otorga la categoría de sustantivo, pero consiente su uso como tal. Es solo mi opinión y, como digo, creo que deberíamos discutirlo con carácter más general, llegar a un acuerdo y plasmarlo en el documento del wiki.

Pompilos commented 11 months ago

Hola, el artículo de la wiki Cómo colaborar con RLA-ES, por el que me he guiado, dice que «En general, se añaden todas las palabras admitidas por el Diccionario de la Lengua Española de la RAE». Tu afirmación de que «no es realista pensar que podemos tener todos los lemas existentes en el diccionario» implica que hay una limitación de tamaño, que es más importante que el hecho de que un diccionario con menos lemas da (a mí me los está dando, por eso he detectado la ausencia de esos lemas) falsos positivos, palabras que marca como errores ortográficos sin serlo.

Desconozco cuál es el tamaño del diccionario con los lemas expandidos, ni en qué medida eso supone un problema. Hace años un procesador de texto ocupaba 40 MB, y ahora muchos programas ocupan fácilmente 500 MB, porque hacen más cosas y las hacen mejor. Para mí hace las cosas mejor un diccionario que solo dé verdaderos positivos (faltas de ortografía), no falsos positivos con las palabras poco frecuentes.

Si decidimos que no todas las palabras que salen en el DRAE deben incluirse, alguien debe convertirse en juez de cuáles sí y cuáles no. Yo leo sobre navegación a vela y «sobrejuanete» me parece una palabra importante; otro lee sobre mecánica y opina que «polispasto» lo es. ¿Alguien va actuar de juez y decidir que no se incluya el primero pero sí el segundo, como ocurre ahora? En ese caso, puedo decidir que este no es mi diccionario (lo cual, dicho sea de paso, no es ningún drama, porque la mayoría de los diccionarios del mundo no lo son).

En espera de que se objetiven los criterios de inclusión de palabras, suspendo mi contribución al diccionario. Un cordial saludo.

RickieES commented 11 months ago

Hola, el artículo de la wiki Cómo colaborar con RLA-ES, por el que me he guiado, dice que «En general, se añaden todas las palabras admitidas por el Diccionario de la Lengua Española de la RAE». Tu afirmación de que «no es realista pensar que podemos tener todos los lemas existentes en el diccionario» implica que hay una limitación de tamaño, que es más importante que el hecho de que un diccionario con menos lemas da (a mí me los está dando, por eso he detectado la ausencia de esos lemas) falsos positivos, palabras que marca como errores ortográficos sin serlo.

Bueno, vamos a tratar este tema en un issue específico para fijar un poco mejor los criterios. Trataremos de poner cifras que nos ayuden a todos a tomar la decisión, pero para que no se me olvide lo que tengo en la cabeza, lo pongo aquí y lo trasladaré al issue cuando lo abra.

Por supuesto que hay una limitación de tamaño, como es lógico. Voy a exagerar en varios órdenes de magnitud, pero un diccionario que contenga todos los términos y tenga un tamaño de 8 GB sería inútil en la práctica, porque nadie querría tener que destinar esa cantidad de memoria solo a revisar palabras. Dividamos por 100 y pongamos que el diccionario ocupa unos 80 MB de RAM en memoria. Seguiría siendo un problema porque:

Así que, sí, el tamaño importa. Lo que tenemos que decidir ahora es a partir de qué cantidades y si debemos preocuparnos o no.

Si decidimos que no todas las palabras que salen en el DRAE deben incluirse, alguien debe convertirse en juez de cuáles sí y cuáles no. Yo leo sobre navegación a vela y «sobrejuanete» me parece una palabra importante; otro lee sobre mecánica y opina que «polispasto» lo es. ¿Alguien va actuar de juez y decidir que no se incluya el primero pero sí el segundo, como ocurre ahora?

Aquí hay varias cuestiones:

En ese caso, puedo decidir que este no es mi diccionario (lo cual, dicho sea de paso, no es ningún drama, porque la mayoría de los diccionarios del mundo no lo son).

En espera de que se objetiven los criterios de inclusión de palabras, suspendo mi contribución al diccionario. Un cordial saludo.

Como digo, vamos a fijar los criterios. Mi sensación es que sigo viendo lemas que me resultan de uso común marcados como incorrectos, pero quizá lo son en mi ámbito laboral o de aficiones y no son tan comunes para el público en general, seguramente lo mismo que te pasa a ti con los que estás añadiendo y que yo, confieso, no había visto jamás. :smiley: También he visto el tamaño actual del diccionario (es-ES, en este caso) y estamos aún lejos de esos 80 MB que he puesto de ejemplo (aunque ya no llegamos a un orden de magnitud por debajo). Veamos el impacto real del diccionario y, si hay que quitar "En general" y poner en negrita que todos los lemas que estén en la RAE se añaden, iré corriendo yo mismo al wiki a hacerlo. :wink:

olea commented 11 months ago

Yo voto por incorporar todas las propuestas, con las correcciones técnicas de implementación que se precisen.

RickieES commented 11 months ago

Ayer abrí el issue que prometí para tratar el tema:

https://github.com/sbosio/rla-es/issues/292

Y ya he puesto mi opinión, a la espera de que alguien más se anime a hacer pruebas de rendimiento y confirme o corrija mis conclusiones preliminares.

RickieES commented 11 months ago

Veo estas dos cuestiones: