Closed fjuniorr closed 2 months ago
Vale a pena registrar o motivo pelo qual o teste check_valores_sigplan_programas não conseguiu pegar os valores duplicados relatados pela DCPPN:
Além disso, o programa 44 também parece que está com linha duplicada na base programas.
Como a base programas pode ter corretamente linhas que duplicam o valor total do programa, o teste remove linhas duplicadas antes de fazer a comparação com a base acoes_planejamento
@hslinhares o bug da frictionless aqui é que uma coluna que é listada como chave primária não poderia aceitar valores NULL .
Como o bug ainda não foi corrigido (que seria nossa primeira opção) as outras alternativas que temos é:
unique
em cada coluna que está listada como chave primáriavalidate::is_unique
e is.na
com o pacote validate
do R para criar uma função de teste de chaves compostas no pacote https://github.com/splor-mg/checks-planejamentoAcho que a segunda opção é melhor porque também serve como aprendizado.
Os problemas na versão https://github.com/splor-mg/ppag-planejamento-dados-2024/tree/a950492b20bd810485fcc92e22570386d268e11e da base
Deveriam ter sido apontados pela validação mas não foram por causa de um bug nas dependências do projeto https://github.com/frictionlessdata/frictionless-py/issues/1623