turicas / covid19-br

Dados diários mais recentes do coronavírus por município brasileiro
https://brasil.io/dataset/covid19
GNU Lesser General Public License v3.0
531 stars 128 forks source link

Criar um serviço de validação de CSV para oferecer às secretarias #108

Open augusto-herrmann opened 4 years ago

augusto-herrmann commented 4 years ago

O governo francês usa um sistema chamado Validata, software livre criado pelo Etalab, para oferecer aos órgãos da administração pública validar arquivos CSV antes de publicá-los. O software usa o padrão Table Schema do Data Package, o mesmo que já usamos aqui.

Poderíamos oferecer algo semelhante às Secretarias Estaduais de Saúde, depois que tivermos o esquema de CSV sugerido já definido (#89). As secretarias criariam o seu CSV conforme a recomendação definida e, antes de publicá-los em seu site, fariam o upload na ferramenta para verificar se ele está conforme o esquema definido e receberiam o feedback. Se houver algum erro, já vem a mensagem dizendo o que precisa ser corrigido (ex.: coluna faltando, tipo de dados errado, linha duplicada, etc.).

O problema é que o software Validata está em francês. Então seria necessário traduzi-lo para o português. Mas suponho que a quantidade de texto não seja muito grande. Além disso, após estar definido o esquema para os CSV, é necessário configurar a ferramenta para oferecer esse esquema para validação.

augusto-herrmann commented 4 years ago

O código fonte do Validata pode ser encontrado aqui:

https://git.opendatafrance.net/validata

turicas commented 4 years ago

https://www.camara.leg.br/noticias/658327-projeto-preve-transparencia-e-parametros-minimos-para-dados-sobre-pandemia/