PabloCastellano / bormeparser

A Python library for parsing BORME files (Boletín Oficial del Registro Mercantil in Spain).
GNU General Public License v3.0
47 stars 20 forks source link

Company name parsing issue #13

Open skenaja opened 7 years ago

skenaja commented 7 years ago

Here's a gazette notice with two entries for empresa, one of which is blank - the output has a blank empresa value, and it should probably pick the first, non-blank company

https://boe.es/borme/dias/2010/07/02/pdfs/BORME-A-2010-125-28.pdf

264604 - INSTALACIONES ELUR SOCIEDAD LIMITADA.
264604 - .
Revocaciones. Apoderado: PALACIOS GARCIA MERCEDES. Nombramientos. Apoderado: PALACIOS GARCIA MERCEDES.
Cambio de domicilio social. AVDA FUENTE NUEVA 14 - NAVE 19 A. (SAN SEBASTIAN DE LOS REYES). Datos registrales. T
24168 , F 120, S 8, H M 434291, I/A 2 (23.06.10)

output:

 "264604": {
      "actos": [
        {
          "Revocaciones": {
            "Apoderado": [
              "PALACIOS GARCIA MERCEDES"
            ]
          }
        },
        {
          "Nombramientos": {
            "Apoderado": [
              "PALACIOS GARCIA MERCEDES"
            ]
          }
        },
        {
          "Cambio de domicilio social": "AVDA FUENTE NUEVA 14 - NAVE 19 A. (SAN SEBASTIAN DE LOS REYES)."
        }
      ],
      "datos registrales": "T 24168 , F 120, S 8, H M 434291, I/A 2 (23.06.10).",
      "empresa": "",
      "liquidacion": false,
      "num_actos": 3,
      "registro": "",
      "sucursal": false