okfn-brasil / gastos_abertos

Código principal do projeto Gastos Abertos.
GNU Affero General Public License v3.0
9 stars 7 forks source link

Arrumar idenficador de códigos #194

Closed andresmrm closed 9 years ago

andresmrm commented 9 years ago

Algumas colunas de execução não começam com "cd_" mas são códigos.

Isso está gerando problemas na normalização delas (quando baixa os dados). https://github.com/okfn-brasil/gastos_abertos_dados/blob/bf1c52f826fa48b1515e7b021568438ec631da80/utils/execucao_downloader.py#L61-L64

E na inserção no BD, já que não estão compondo o código. É possível que alguns dados estejam sendo descartados por conta disso. https://github.com/okfn-brasil/gastos_abertos/blob/e114c9cfd9442434ada1cfc93112922fe7d008a5/utils/import_execucao.py#L67-L70

Talvez usar todas as colunas que pareçam inteiro?

andresmrm commented 9 years ago

Aparentemente não está perdendo nenhuma linha que não tenha todos os valores não monetários iguais. As que tem todos os valores não monetários iguais estão sendo somadas, pois não tem como distinguí-las... Ele está agora avisando, na hora que baixa, quando isso acontece.

Escolher um código único ainda não é uma tarefa exata, pois podem surgir novas colunas. Mas do jeito que está, se surgirem códigos únicos repeditos ele deve avisar na hora que baixa.