datosgobar / georef-ar-etl

ETL del Servicio de Normalización de Datos Geográficos de Argentina.
https://apis.datos.gob.ar/georef
MIT License
7 stars 5 forks source link

Tamaños de tablas esperados configurables #143

Open federicotdn opened 5 years ago

federicotdn commented 5 years ago

Gran parte de los procesos internos del ETL cuentan con un paso de tipo ValidateTableSizeStep. El paso toma como parámetro un tamaño que se espera que la tabla tenga al finalizar la extracción de datos. Si el valor es distinto (o fuera de un rango permitido), la extracción falla, para evitar generar listas de entidades incompletas. Por ejemplo, para provincias (provinces.py) el valor esperado es 24. Para otras entidades, el valor es menos obvio y fue determinado experimentalmente, a partir de extracciones anteriores del ETL. Todos los valores están escritos en el código fuente.

Se debería flexibilizar el sistema para que el número de entidades esperadas pueda configurarse a través de georef.cfg. De esta forma, se podría adaptar rápidamente el ETL en caso de que la fuente de los datos modifique la cantidad de entidades disponibles.