okfn-brasil / perfil-politico

Este repositório não está recebendo atualizações | A platform for profiling public figures in Brazilian politics
https://perfilpolitico.serenata.ai/
GNU General Public License v3.0
163 stars 40 forks source link

[Consistência de dados] Dados de candidatos duplicados #195

Closed arielbello closed 2 years ago

arielbello commented 2 years ago

Encontrei dados de candidatos duplicados no banco, conforme o screenshot abaixo:

Image

ogecece commented 2 years ago

Eita! Essa correção é bem prioritária, podemos colocar na sprint 8, certo?

arielbello commented 2 years ago

Queria entender o que pode ter causado isso. Eu acabei de rodar a mesma query no meu banco local, que só foi carregado pelo dump e parece que está tudo certo:

Image

arielbello commented 2 years ago

Investiguei junto com @giuliocc e descobrimos que os dados não estão duplicados, são de fato 3 candidaturas do Haddad, porém uma é para presidente no primeiro turno, outra para presidente no segundo turno e a última para vice-presidente da qual renunciou. No caso de Lula foi uma candidatura indeferida. Com isso supomos que todos os dados de candidatura estejam corretos.

arielbello commented 2 years ago

Seguindo a investigação, vimos que a API não retorna o campo status (situacao_candidatura) nem o campo round (turno), sendo assim não é possível filtrar os políticos que não estão de fato concorrendo no primeiro turno. Foi criada a issue #196 para adicionar esses campos na API