Gran parte de los procesos internos del ETL cuentan con un paso de tipo ValidateTableSizeStep. El paso toma como parámetro un tamaño que se espera que la tabla tenga al finalizar la extracción de datos. Si el valor es distinto (o fuera de un rango permitido), la extracción falla, para evitar generar listas de entidades incompletas. Por ejemplo, para provincias (provinces.py) el valor esperado es 24. Para otras entidades, el valor es menos obvio y fue determinado experimentalmente, a partir de extracciones anteriores del ETL. Todos los valores están escritos en el código fuente.
Se debería flexibilizar el sistema para que el número de entidades esperadas pueda configurarse a través de georef.cfg. De esta forma, se podría adaptar rápidamente el ETL en caso de que la fuente de los datos modifique la cantidad de entidades disponibles.
Gran parte de los procesos internos del ETL cuentan con un paso de tipo
ValidateTableSizeStep
. El paso toma como parámetro un tamaño que se espera que la tabla tenga al finalizar la extracción de datos. Si el valor es distinto (o fuera de un rango permitido), la extracción falla, para evitar generar listas de entidades incompletas. Por ejemplo, para provincias (provinces.py
) el valor esperado es 24. Para otras entidades, el valor es menos obvio y fue determinado experimentalmente, a partir de extracciones anteriores del ETL. Todos los valores están escritos en el código fuente.Se debería flexibilizar el sistema para que el número de entidades esperadas pueda configurarse a través de
georef.cfg
. De esta forma, se podría adaptar rápidamente el ETL en caso de que la fuente de los datos modifique la cantidad de entidades disponibles.