Open fjuniorr opened 3 years ago
Para referência as instruções que removi do README.
Na versão datapackage$version
desse conjunto de dados foi necessário realizar um tratamento na série histórica dos arquivos para adequação ao documentado no datapackage.json
.
Além disso, foi necessário:
Essa tratamento ocorreu uma única vez, com a seguinte sequência de scripts:
download_servidores.R
Download de 91 arquivos (jun/2012 até dez/2019) para data-raw/servidores/
que sofreram tratamentos manuais descritos aqui
download_cbmmg.R
Download de 84 arquivos (jan/2012 até dez/2018) para data-raw/cbmmg/
. As seguintes alterações manuais devem ser feitas:
Essas operações podem ser executadas com
make download
clean_cbmmg.R
Limpeza e padronização das planilhas data-raw/cbmmg/
e staging em data/cbmmg/
rem_pos
) =
remuner
)teto
)ferias
)decter
)(premio
)feriasprem
)jetons
)eventual
)ir
)prev
)
Os scripts desse projeto estão demasiadamente complexos porque foram desenvolvidos "na correria" para atendimento do pedido de acesso à informação 1520000062202067 e tiveram de lidar com a limpeza dos arquivos da série histórica, que apresentavam diversas inconsistências em termos de formatação e conteúdo.
Ao invés de refatorar e documentar esses scripts de forma adequada para lidar com a dívida técnica, vou optar por separar os scripts necessários para reprodução da série histórica dos scripts necessários para atualização mensal do conjunto de remuneração.
Ainda não sei se deixo no mesmo repositório em um branch separado, ou se crio outro repo.