sbosio / rla-es

Recursos lingüísticos abiertos del español
Other
216 stars 48 forks source link

División silábica en palabras compuestas #196

Open Sanipachenko opened 5 years ago

Sanipachenko commented 5 years ago

La separación silábica se hace mal en muchas palabras donde hay una palabra compuesta. Por ejemplo: desayuno, en vez de separar "de-sa-yu-no" separa "des-a-yu-no" Es el más reciente que tengo, pero he visto varios casos similares en el texto que estoy redactando. imagen

sbosio commented 5 years ago

¿Qué versión del diccionario tienes instalada? La versión 2.3 incorporó unas reglas con el formato incorrecto y daba ese tipo de errores. Se corrigió en la versión 2.4.

Sanipachenko commented 5 years ago

La 2.4. imagen LibreOffice 6.1.5, pero bajé la extensión desde la web de extensiones.

Sanipachenko commented 5 years ago

Estimado: Yo estaba convencido que la división correcta es "DE-SA-yuno" pero en un libro leí "des-orientada". Así que consulté a la FUDÉU y me confirman que en estos casos cualquiera de las dos separaciones son correctas. Añado el vínculo al documento que me pasaron como origen de esto. Espero te sirva. http://aplica.rae.es/orweb/cgi-bin/v.cgi?i=QGxclzADsidhhXfQ&fbclid=IwAR0KYo_MPJfyci3TonQfGG2axSv1VGYcQCA1z2SuWTFsmNRUKagDQPhnycI

cosmoscalibur commented 5 years ago

@sbosio , coincido con la afirmación final de @Sanipachenko , en este caso por ser tener un prefijo en la formación es posible la separación reportada, por lo cual este reporte podría cerrarse.

sbosio commented 5 years ago

Sí @Sanipachenko y @cosmoscalibur, justamente el fichero de entrenamiento está preparado de acuerdo con las recomendaciones de la ortografía de la RAE, donde hay muchas más recomendaciones aplicadas, como por ejemplo, no se permite la división si la última sílaba es '-no', para no dejar el lema 'no' como principio de renglón, ya que podría generar confusión durante la lectura. O grafías consideradas malsonantes como 'culo' (artículo se divide como 'ar-tícu-lo', aún cuando por silabeo sería válido 'ar-tí-cu-lo', pero puede dejar 'culo' al principio del siguiente renglón.

No se pueden abarcar todos los casos, como este que se discute aquí. En estos casos, que hay dos separaciones posibles, hay que elegir una de las dos. El tema es si consideramos la palabra desayuno como consistente en un prefijo "des" y el lema "ayuno", que etimológicamente seguro tiene ese origen, pero a veces en algunos términos se pierde esa composición o no suena natural.

Por ejemplo, para el verbo 'desarrollar' y sus lemas relacionados he preferido la separación silábica 'de-sa-rro-llar', aún cuando según la RAE deriva del prefijo 'des-' y la primera acepción del verbo 'arrollar'. Pero separarlo 'des-arro-llar' a mí me suena antinatural (aunque no sería incorrecto). Por ahí podemos modificar el fichero de entrenamiento para que 'desayunar' y sus lemas relacionados se separen como 'de-sa-yu-nar' si les parece más natural.

Les dejo la inquietud.

¡Saludos!

Sanipachenko commented 5 years ago

El idioma español y sus complejos conceptos pero que, con consenso resulta maravilloso. En lo personal, me resulta chocante, incómodo de leer (desagradable) ver separado "des-ayunar"... Creo que la mejor opción es "de-sa-yu-nar" (ha surgido esa palabra a modo de ejemplo, pero aplica a varias divididas así). De hecho, muchos que han leído mis escritos les ha resultado incómodo y lo han considerado un error.. Creo que "de-sa" es más "literario" y más común en el día a día de la gente. Es en lo personal la mejor opción.

sbosio commented 5 years ago

Perfecto. Si hay consenso, procedemos a realizar los cambios y reentrenar el separador para la próxima versión. En este caso estoy de acuerdo con @Sanipachenko en que es más natural la separación silábica que la compositiva.

olea commented 4 years ago

Perfecto. Si hay consenso, procedemos a realizar los cambios y reentrenar el separador para la próxima versión. En este caso estoy de acuerdo con @Sanipachenko en que es más natural la separación silábica que la compositiva.

@sbosio ¿alguna novedad? ¿algo que yo pueda arreglar entre hoy y mañana? (nunca he tocado el hyphen-es).