sbosio / rla-es

Recursos lingüísticos abiertos del español
Other
222 stars 49 forks source link

Palabras faltantes y propuesta #8

Closed RickieES closed 8 years ago

RickieES commented 10 years ago

Corresponde al registro 770 de de RLA-ES en Forja.rediris.es Creado por Daniel Gómez Martínez (dagomezma) con fecha y hora 2013-11-18 05:52

Hola a todos, soy nuevo en el proyecto y quería empezar este nuevo hilo en el foro para discutir con todos una propuesta que tengo, dos preguntas, y para informar sobre algunas palabras faltantes.

Empezaré con las preguntas:

Propuesta:

Además, en cuanto tenga algo de tiempo agregaré los topónimos más importantes de Colombia dentro de la localización específica.

Palabras faltantes:

Palabras que sí están en el diccionario de la RAE:

Palabras que no están en el diccionario de la RAE:

Estas irían para ...noRAE/Adverbios.txt

subsecuentemente (subsecuente sí está en dicc. RAE) concatenadamente concadenadamente concéntricamente

RickieES commented 8 years ago

No voy a hacer cambios hasta que acabemos de publicar la versión 2.1, pero voy a comenzar respondiendo a las preguntas que hizo el autor del bug original en Forja:

¿Para las palabras se pueden definir reglas para que las marque como error si no están escritas con mayúscula al inicio? Esto sería especialmente útil para los apellidos y topónimos.

Las palabras que se añaden con mayúscula inicial solo se admiten como correctas si se escriben con mayúsculas inicial. Puedes probar con un nombre propio como, por ejemplo, Alejandro.

¿Valdría la pena incluir los nombres propios que sean de compañías, organizaciones, software, etc. ampliamente conocidas?

Este tema se ha tratado varias veces. Hay algunos nombres incluidos en NombresPropiosSiglas.txt de las distintas variantes y para la versión genérica, pero dado que Apache OpenOffice y LibreOffice incluyen su propia lista de nombres propios de compañías y productos de software, entre otros, no hemos querido dedicar mucho tiempo a esa lista por el momento.

RickieES commented 8 years ago
He notado que dentro del repositorio actual los nombres propios (o por lo menos los que he visto) se encuentran en el archivo ...palabras/noRAE/NombresPropiosSiglas.txt. Pienso que sería más organizado si la sección «toponimos/» que acompaña a RAE/ y noRAE/ pasa a formar parte de noRAE/,

En mi opinión, los topónimos no son RAE ni no-RAE. Lo que sí es verdad es que, buscando dentro de noRAE/l10n/es_XX/NombresPropiosSiglas.txt, he encontrado topónimos que habría que extraer. Para esto necesitaremos la ayuda de colaboradores de cada localización, que son los que mejor van a conocer los nombres de ciudades, provincias, estados, accidentes geográficos, etc.

aunque me parecería incluso mejor que haya una nueva sección dentro de «palabras/» que se llame NombresPropiosSiglas y que contenga:

l10n // en donde irían los archivos aquí abajo para cada localización específica
apellidos.txt // en donde irían los apellidos más comunes del español en general
nombres.txt // en donde irían los nombres más comunes del español en general
siglas.txt
toponimos.txt // en donde irían los países del mundo.

Separar las siglas me parece una buena idea. Separar apellidos de nombres lo veo ya más complicado (por ejemplo, Alonso es nombre y apellido a la vez), y los topónimos ya los tenemos estructurados en varios archivos según su naturaleza. Estaría bien que opináramos todos sobre estas sugerencias para encontrar una posición común.

RickieES commented 8 years ago

concadenar ya está reconocida en la versión en desarrollo 2.1 del diccionario. El resto las examinaremos tras la publicación de la versión 2.1 del diccionario.

Almorca commented 8 years ago

Sobre la organización del repositorio no tengo ninguna preferencia así que me quedo con la opción que menos trabajo implique.

edittler commented 8 years ago

La organización de topónimos creo que ya estaría resuelta. De hecho me encantó como están ordenados los topónimos de España. Quizás haga lo mismo para Argentina (y quizás también para Uruguay que es un país hermano :wink:). Por cierto, estaría bueno contactarse con Daniel Gómez Martínez (dagomezma) para que incluya los topónimos de Colombia.

Con respecto a nombres y apellidos, los mantendría en NombresPropiosSiglas.txt extrayendo las siglas a Siglas.txt y renombrando el anterior a NombresPropios.txt. Si por mí fuera, separaría los nombres y apellidos, pero por ahora me parece irrelevante (y nos evitamos decidir la política de inclusión de nombres propios cuando se usa tanto como nombre y apellido).

El asunto de las palabras faltantes te lo dejo a vos @RickieES :blush:

RickieES commented 8 years ago

Voy con las palabras que se pedían añadir:

http://dle.rae.es/?w=quark

Creo que hay una diferencia entre que la palabra esté recogida y que esté admitida, pero tampoco sé cómo podemos distinguir unas de otras. Por de pronto, lo que sí voy a añadir es "cuark", en RAE/NombresMasculinos.txt como cuark/S.

El mensaje con el commit debe de estar encima o debajo de este comentario.

RickieES commented 8 years ago

Vamos con el segundo lote de palabras:

Y de los adverbios:

todos me parecen razonables y, efectivamente, ninguno está recogido en la RAE (aunque creo que todos estarían admitidos), así que los añado en noRAE/Adverbios.txt, como se sugería.

El commit aparece a continuación.

RickieES commented 8 years ago

Las palabras que quedan pendientes son:

De las cuestiones sobre organización de archivos, lo que parece que plantea más consenso sería separar las siglas a un archivo propio Siglas.txt y renombrar el archivo actual a NombresPropios.txt. Como comenté, lo de separar nombres de apellidos lo veo un poco subjetivo y no sé si muy importante en relación al trabajo que ocasionaría.

edittler commented 8 years ago

Yo agregaría la palabra "capacitor". Soy estudiante de ingeniería y es una palabra que se usa mucho. Inclusive así figura la palabra en las traducciones oficiales de los libros más populares del área de Física e Ingeniería.

Puede ir dentro de no RAE.

Almorca commented 8 years ago

Pues confirmo que quark no está aceptado ( https://twitter.com/almorca_es/status/749510719620743168 ) Capacitor no la añadiría ya que en español tenemos la palabra condensador.

El resto de palabras son muy específicas y no tengo claro si merece la pena añadirlas.

edittler commented 8 years ago

En Argentina no conozco a nadie que use la palabra "condensador". Los libros que mencioné son de editoriales mexicanas. ¿Se podría agregar "capacitor" a no RAE en los países latinoamericanos?

Dato de color: una búsqueda de cada término en Google me da la siguiente cantidad de resultados

RickieES commented 8 years ago

@ezeperez26, ¿crees que podríamos obtener una referencia de en qué países es habitual el uso de "capacitor" en lugar de "condensador"? O, si no, ¿tú podrías darnos una referencia inicial para añadir la palabra en esas localizaciones y luego extenderla a otros según se vaya requiriendo?

Confieso que, a mí, "capacitor" me suena a calco del inglés más que a construcción derivada del verbo capacitar. El aparato en sí no capacita (habilita) nada, sino que condensa o recoge energía eléctrica (entiendo que lo de recoger es por lo que en inglés se le llama capacitor, por lo que le cabe, por su capacidad).

edittler commented 8 years ago

Ricardo, en varios lados, por ejemplo en Wikipedia, se dice que el término capacitor es un anglicismo de la palabra capacitor.

Con respecto a los países, en Argentina se usa hasta en instituciones de educación superior (lo puedo decir como alumno universitario). Como dije anteriormente, la bibliografía traducida en español utilizada también utiliza la palabra "capacitor", al menos el libro de Resnick, Fisica Vol 2. Hay otros libros muy populares como Alonso Finn, Sears Semansky, Tipler que no tengo a mano para comprobar.

No seguiré insistiendo en el tema (veo que hay resistencia a agregarla), pero es un término que se encuentra muy asimilado en el lenguaje argentino, a tal punto que la palabra condensador nos queda extraño al referirnos al dispositivo electrónico, asociándolo más a los condensadores de heladeras.

A las estadísticas de uso por países te las debo. En los corpus de RAE no parece haber textos científicos, o parece que no incluye los textos traducidos (en la ciencia, los mejores libros son en inglés).

Almorca commented 8 years ago

Me parece que van a sugir casos dónde haya diferente criterio entre el español de América latina y de España sobre todo en términos tecnológicos. Para mí el caso más sonado es la eterna discusión de la Wikipedia entre mouse/ratón de ordenador. En la mayoría de casos América latina está más influenciada por palabras inglesas que España, sin embargo la RAE es muy reacia a incluir estas palabras. Si buscamos en Google scholar podemos comparar el uso académico de capacitor [ https://scholar.google.es/scholar?hl=es&q=capacitor&btnG=&lr=lang_es ] y condensador [ https://scholar.google.es/scholar?q=condensador&btnG=&hl=es&lr=lang_es&as_sdt=0%2C5 ] y condensador tiene más resultados. He planteado una consulta a la académia argentina (se puede hacer en http://www.aal.edu.ar/node/186 ). Con lo que me respondan os digo y tomamos una decisión.

P.D. Perdonad el cierre de la incidencia pero se me ha ido el dedo.

RickieES commented 8 years ago

Yo iba a mencionar justo el caso de mouse. Como creo que mouse sí está añadido para es-AR, no creo que haya problema en añadirlo para capacitor, pero ya que has hecho la consulta, mejor esperamos. :+1:

sbosio commented 8 years ago

Yo coincido en que al menos en Argentina está más extendido el uso del anglicismo capacitor, en vez de condensador. Además, para referirse a la persona que capacita se utiliza 'capacitador' (término que tampoco recoge la RAE).

El martes, 5 de julio de 2016, Ricardo Palomares notifications@github.com escribió:

Yo iba a mencionar justo el caso de mouse. Como creo que mouse sí está añadido para es-AR, no creo que haya problema en añadirlo para capacitor, pero ya que has hecho la consulta, mejor esperamos. 👍

— You are receiving this because you are subscribed to this thread. Reply to this email directly, view it on GitHub https://github.com/sbosio/rla-es/issues/8#issuecomment-230425793, or mute the thread https://github.com/notifications/unsubscribe/ABO0GPsT_nF71Rdh-r9D-q7M9s-ZV0z5ks5qSh7pgaJpZM4CPtZg .

edittler commented 8 years ago

Envié una consulta a Fundeu, me respondieron lo siguiente:

Se trata de un nombre ideado con el fin de crear una terna de términos uniformes: resistor, inductor, capacitor. Al no haber salido del ámbito técnico es normal que el DRAE no lo incluya (lo cual no significa que lo rechace), pues esta obra no recoge más que una selección de términos técnicos usuales. No le podemos confirmar la distribución de uso, aunque al menos en España también conviven ambas formas (condensador la más general, capacitor la más técnica).

Almorca commented 8 years ago

Me han respondido de la Academia Argentina de Letras

Se trata de un tecnicismo que, si bien no figura en los diccionarios del español general que hemos consultado, tiene mucho uso en textos o en vocabularios de carácter técnico. Su empleo en estos contextos es correcto. Si se está redactando un texto de divulgación, conviene definir brevemente el término.

Por los comentarios que hemos recabado yo añadiría la palabra al no_RAE general y crearía una página en el wiki de palabras controvertidas donde podamos dejar registro de los argumentos para añadir la palabra. ¿Qué os parece?

RickieES commented 8 years ago

Pues nada, añadida. En lugar de crear la página en el wiki, de momento he sido simple y he añadido un comentario junto a la palabra remitiendo a este issue.

Creo que, en cuanto a palabras, ya habríamos terminado. Solo queda, si todos estáis de acuerdo, extraer las siglas a un archivo independiente y renombrar los archivos NombresPropiosSiglas.txt a NombresPropios.txt. Ahora bien, ahora mismo contaríamos con la increíble cifra de... 2 siglas (CD y DVD). :smile: ¿Merece la pena? ¿Añadimos otras siglas, como ADSL, ONU, UNESCO, FAO, FMI, UE, USA, UK, SEPA, IBAN, BIC, SWIFT? Seguiríamos teniendo solo catorce entradas.

edittler commented 8 years ago

Me parece bien lo de agregar el comentario en la línea de la palabra en cuestión. Administrar una página de la wiki puede ser tedioso en un futuro.

Con respecto a las siglas, me parece bien la propuesta de separar Siglas.txt siempre cuando no implique un gran esfuerzo, dados los plazos, ya habría que hacer lo mismo en todas las localizaciones.

Por ahora añadiría las siglas que no se refieran a organizaciones, por ejemplo, no añadiría ONU, UNESCO, FAO, FMI. Las siglas de países o regiones tampoco las agregaría a menos que se demuestre su uso frecuente, por ejemplo, como podría ser UE en España (sólo en es_ES).

Hay siglas que están reconocidas por RAE, pero están dentro de noRAE, como también aparecen los plurales de siglas, que no están permitidas por RAE.

De todas maneras, este asunto de las siglas las trataría en un issue a parte para otro release, citando lo que se dijo al respecto en este issue.

RickieES commented 8 years ago

He creado el issue #88 y con ello ya podemos cerrar este.