PabloCastellano / bormeparser

A Python library for parsing BORME files (Boletín Oficial del Registro Mercantil in Spain).
GNU General Public License v3.0
47 stars 20 forks source link

Problema con las provincias #110

Open abediaga opened 1 year ago

abediaga commented 1 year ago

Hola,

A la hora de parsear el PDF de un BORME con bormeparser.parse da un error en las provincias de: ALICANTE/ALACANT CASTELLON/CASTELLO VALENCIA/VALENCIA

Lo curioso es que en el caso de ARABA/ÁLAVA no da error.

¿Puede ser por la cláusula definida el "provincia.py" para Araba pero no para el resto de provincias?

def from_title(title): try: if title == 'ARABA/ÁLAVA': return PROVINCIA.ALAVA title = removeaccents(title).replace(' ', '') return getattr(PROVINCIA, title) except AttributeError: raise ValueError('InvalidProvince: %s' % title)

Un saludo.

abediaga commented 1 year ago

He modificado provincia.py con el siguiente código y parece que funciona.

def from_title(title):
    try:
        if title == 'ARABA/ÁLAVA':
            return PROVINCIA.ALAVA
        elif title == 'ALICANTE/ALACANT':
            return PROVINCIA.ALICANTE
        elif title == 'CASTELLON/CASTELLO':
            return PROVINCIA.CASTELLON
        elif title == 'VALENCIA/VALENCIA':
            return PROVINCIA.VALENCIA
        title = remove_accents(title).replace(' ', '_')
        return getattr(PROVINCIA, title)
    except AttributeError:
        raise ValueError('InvalidProvvince: %s' % title)
PabloCastellano commented 1 year ago

Hola Aitor,

De vez en cuando la Agencia que publica los Boletines Oficiales decide hacer algunos cambios en el formato y este fue uno de ellos.

En cuanto a la solución, me parece correcta. Pull requests are welcome! :smiley: