Esse PR é a continuação do pr #446, por conta de problemas com o git, resolvi abrir um novo PR.
Está é uma versão funcional, mas ainda tem valores que não estão sendo tratados corretamente, como por exemplo as colunas de dif auxilio alimentação.
Esse PR possui:
Parser: o arquivo parser.py faz a leitura das planilhas e cria um doc .csv(uso o formato .csv pois acho mais simples de manipular). Ele também chama o parser_remuneration, que trata as planilhas de remuneração, e o update_remuneration, que trata as planilhas de verbas indenizatórias, e atualiza o json retornados pelo parser_remuneration.
Tests: feito pelo parser_test,.py, ele usa planilhas .html que estão dentro da pasta output_test, como material de teste. As planilhas dentro de output_test, tem os valores originais das planilhas que vem do site mpma, a planilha usada nos testes pode ser vista aqui.
Table: metodos usados para formatar os valores e validar a existência de determinada coluna em uma tabela.
Nesse PR mando o parser do coletor MPMA
Está é uma versão funcional, mas ainda tem valores que não estão sendo tratados corretamente, como por exemplo as colunas de dif auxilio alimentação. Esse PR possui:
Revisores: @danielfireman, @marcos-inja