sbosio / rla-es

Recursos lingüísticos abiertos del español
Other
213 stars 48 forks source link

Propuesta de nombres propios #265

Open pereelmagne opened 2 years ago

pereelmagne commented 2 years ago

Pere Farrando

perefarrando2@gmail.com

Propuesta de entradas para la extensión Hunspell de idioma español

Nombres propios

AENA (sin partición) Alberto Alcorcón Alfredo Alguer Aleixandre Amberes Ampurdán Ámsterdam (Áms-ter-dam, no Ám-ster-dam; Ortografía lengua española 2010, p405) Aníbal Arán Arévalo Atapuerca Aurelia Aurelio Basilea Bilbao Bolshói (Bol-shói) Bonaparte Calígula Caronte Carlos Castellblanch (Cas-tell-blanch, no Cas-te-ll-blanch) Cerdeña Citroën Claudio Clitemnestra Coriolano Córcega Dalila Damm Demetrio Delhi (Del-hi; Ortografía lengua española 2010, apartado f, p406-407) Diocleciano Domiciano Dorotea Dubrovnik Dubái Echegaray Efraím Egeo Emporion Enríquez Escandinavia Escobedo Espartaco Esopo Everest Ezequiel Fedra Feroe Figueruelas Finisterre Flórez Freud Ginesa Godoy Granollers Grandvalira Guadiana Guijuelo Hollywood (Hol-ly-wood, según dicc. Merriam-Webster) Händel Ibiza IRPF (sin partición, sigla de 'impuesto sobre la renta de las persona físicas') Jimeno Lavapiés Lerroux Liechtenstein (Liech-ten-stein según dicc. Pons; no Liec-h-tens-tein) Llafranc Machín Majadahonda (Ma-ja-dahon-da; Ortografía lengua española 2010, apartado f, p406-407) Marcela Marcelo Massachusetts (Mas-sa-chu-setts segun dicc. Merriam-Webster) MOMA Múnich Numancia Nuremberg Ordóñez Otelo Otilia Otón Ovidio PSOE Renault S’Agaró (S’A-ga-ró) Safo Sajonia Seat Shanghái (Shan-ghái, pronunciaciíon española; no Sha-n-ghái) Sófocles Springsteen (Spring-steen; segú Merriam-Webster, no Springs-teen) Tarancón Teide Tijuana Toulouse (Tou-louse según pronuncia francesa; no Tou-lou-se)Microsoft Transilvania Veracruz Villoro Vivaldi Vic Voll-Damm Waterloo Yucatán Zúrich

Pompilos commented 10 months ago

Hola. No sé cuál es el criterio para decidir qué nombres propios se añaden. Yo, por mi parte, añadiría estos 60, que incluyen títulos de libros del Antiguo Testamento (Deuteronomio), personajes (Ulises) y lugares muy importantes (Londres). Lo que no sé es cómo se indica al corrector la separación de sílabas, si es que se hace. ¿Los añado ya?

Abel, Alabama, Aladino, Amberes, Ámsterdam, Andrómeda, Belcebú, Bombay, Borbón, Boston, Cambridge, Canaán, Carlomagno, Caín, Chicago, Cleopatra, Constantinopla, Corfú, Damocles, Deuteronomio, Eclesiastés, Elba, Estambul, Euclides, Éufrates, Fidias, Ganges, Gomorra, Hamlet, Harvard, Himalaya, Isaías, Job, Jonás, Josué, Judea, Judit, Lombardía, Londres, Luciano, Malaquías, Mármara, Neptuno, Nínive, Orión, Oxford, Paracelso, Perseo, Persia, Prometeo, Sodoma, Sumatra, Tahití, Terranova, Texas, Tigris, Trafalgar, Ulises, Vitruvio.

pereelmagne commented 10 months ago

Sobre la lista: No veo ningún problema en los nombres que das. Solo ocurre que están mezclados topónimos con nombres de persona y de personajes literarios o de otro tipo. No pasa nada, pero al manejar grandes listas de palabras creo que es mejor estar organizado. Además, sería bueno tener fuentes abiertas, de dominio público, por ejemplo, nombres de ciudades de España, de Europa, de Argentina, etc. Esto permitiría enriquecer de golpe y de una forma más sistemática el corrector. Habría que saber si hay algún nomenclátor abierto que se pueda revisar y luego volcar.
Por ejemplo, he encontrado esta página donde se puede descargar el "Nomenclátor Geográfico Básico de España" en XML: https://datos.gob.es/es/catalogo/e0dat0002-nomenclator-geografico-basico-de-espana

Sobre las particiones: En Hunspell, el verificador ortográfico y el motor de particiones van separados. El verificador consta de los ficheros ".aff" i ".dic", mientras que las particiones están en el fichero "hyph_es.dic". Por lo tanto, entiendo que un nombre propio puede ser reconocido, porque conste en el verificador, pero tener una partición incorrecta, porque el motor de particiones no la resuelve bien. Y viceversa, que el topónimo esté en el motor de particiones no quiere decir que sea reconocido por el verificador. Las reglas de Hunspell se basan en la biblioteca "libhyph", pero en este tema no puedo decir nada, porque no soy programador.

Pompilos commented 9 months ago

Hola.

1) Es cierto que sería mejor que los nombres propios se listaran en documentos diferentes para antropónimos, topónimos, etc., pero por ahora nadie ha propuesto hacerlo, y la lista actual se llama simplemente «Nombres propios». Tanto tú en tu primer mensaje como yo en el siguiente, nos limitamos a proponer ampliarla.

2) Estaría bien contar con esas bases de datos de dominio público, pero les veo un problema no pequeño. Hablamos de nomenclátores geográficos, porque no creo que haya bases de datos de nombres propios o apellidos, por ejemplo, en los que conste la lengua a la que pertenecen: ¿diferenciarían un español González con tilde de un catalán/catalanizado Gonzalez sin tilde? Sobre los nomenclátores geográficos, tampoco hacen constar el idioma en el que están: contienen el nombre oficial, así que figuraría en ellos Bilbao, en español, junto a Hondarribia en vasco, en vez del español Fuenterrabía. En Wikipedia en español saben/sabemos el enorme problema que supone fijar la forma española de muchos topónimos de zonas bilingües. Si a eso añadimos los topónimos de Hispanoamérica, la tarea es inabarcable. La RAE hace un diccionario con, creo, unos 70.000 nombres comunes, pero nunca se ha atrevido a elaborar un diccionario de topónimos en español, que debería incluir cientos de miles o millones de nombres. Resumiendo, me inclino por dejar el archivo «Nombres propios» e ir añadiendo los más habituales que usuarios como tú y yo propongamos. Eso sí, siempre podemos añadir los topónimos incluidos en la Ortografía de la Real Academia (1999), sección «Topónimos cuya versión tradicional en castellano difiere de la original». Esta práctica es tan peliaguda, que la propia RAE ha eliminado este apartado de la Ortografía... de 2010. Además, habría resolver la duda de si esa lista es de dominio público o no.

3) Sobre las particiones, no he entendido mucho de lo que dices.

Un saludo.

cosmoscalibur commented 9 months ago

Respecto al tema de listados de nombres propios, efectivamente en el proyecto los tenemos clasificados, y tienen contexto también regional. Si topónimos, deben estar en el directorio toponimos, y allí acorde a lo que veo, la propuesta es para una inclusión general, entonces estarían en toponimos-mundo.txt . En el caso de nombres de personajes, esto sería en noRAE/NombresPropiosSiglas.txt, por ser contexto general. En el caso de aplicar alguno para el contexto regional, es revisar en los respectivos directorios en l10n.