transparencia-mg / remuneracao

dataset que contém arquivos da consulta de remuneração mensal dos servidores
https://transparencia-mg.github.io/remuneracao/
0 stars 0 forks source link

Separar scripts para geração dos arquivos da série histórica em repositório/branch específico #37

Open fjuniorr opened 3 years ago

fjuniorr commented 3 years ago

Os scripts desse projeto estão demasiadamente complexos porque foram desenvolvidos "na correria" para atendimento do pedido de acesso à informação 1520000062202067 e tiveram de lidar com a limpeza dos arquivos da série histórica, que apresentavam diversas inconsistências em termos de formatação e conteúdo.

Ao invés de refatorar e documentar esses scripts de forma adequada para lidar com a dívida técnica, vou optar por separar os scripts necessários para reprodução da série histórica dos scripts necessários para atualização mensal do conjunto de remuneração.

Ainda não sei se deixo no mesmo repositório em um branch separado, ou se crio outro repo.

fjuniorr commented 3 years ago

Para referência as instruções que removi do README.


Instruções - Reproduzir série histórica

Na versão datapackage$version desse conjunto de dados foi necessário realizar um tratamento na série histórica dos arquivos para adequação ao documentado no datapackage.json.

Além disso, foi necessário:

Essa tratamento ocorreu uma única vez, com a seguinte sequência de scripts:

Essas operações podem ser executadas com

make download

Regras de validação

Consistência campo calculado - remuneração líquida

Normalização de texto

Links