Closed andresmrm closed 9 years ago
Aparentemente não está perdendo nenhuma linha que não tenha todos os valores não monetários iguais. As que tem todos os valores não monetários iguais estão sendo somadas, pois não tem como distinguí-las... Ele está agora avisando, na hora que baixa, quando isso acontece.
Escolher um código único ainda não é uma tarefa exata, pois podem surgir novas colunas. Mas do jeito que está, se surgirem códigos únicos repeditos ele deve avisar na hora que baixa.
Algumas colunas de execução não começam com "cd_" mas são códigos.
Isso está gerando problemas na normalização delas (quando baixa os dados). https://github.com/okfn-brasil/gastos_abertos_dados/blob/bf1c52f826fa48b1515e7b021568438ec631da80/utils/execucao_downloader.py#L61-L64
E na inserção no BD, já que não estão compondo o código. É possível que alguns dados estejam sendo descartados por conta disso. https://github.com/okfn-brasil/gastos_abertos/blob/e114c9cfd9442434ada1cfc93112922fe7d008a5/utils/import_execucao.py#L67-L70
Talvez usar todas as colunas que pareçam inteiro?