La idea del proyecto es crear un software que pueda extraer cualquier archivo PDF que tenga estados de situación financiera, ya que los campos son siempre los mismos.
Vamos a iniciar editando el cuaderno que voy a subir y esta en esta dirección.
No borrar los archivos anteriormente trabajados, el código es reutilizable
La idea es que el archivo de salida sea único y que cada ejecución este vaya haciendo un append de datos como filas, el archivo de datos quedaría algo similar es este de ejemplo, obviamente con todas las columnas del archivo PDF.
Notar que se aumentaron dos columnas una de EXPEDIENTE, donde consta el número de expediente y la otra ANIO, donde esta la información de año del documento extraido
La idea del proyecto es crear un software que pueda extraer cualquier archivo PDF que tenga estados de situación financiera, ya que los campos son siempre los mismos.
Vamos a iniciar editando el cuaderno que voy a subir y esta en esta dirección.
No borrar los archivos anteriormente trabajados, el código es reutilizable
La idea es que el archivo de salida sea único y que cada ejecución este vaya haciendo un append de datos como filas, el archivo de datos quedaría algo similar es este de ejemplo, obviamente con todas las columnas del archivo PDF.
Notar que se aumentaron dos columnas una de EXPEDIENTE, donde consta el número de expediente y la otra ANIO, donde esta la información de año del documento extraido