Complementando #1, também são necessários testes sobre o zip de distribuição. O teste de integridade (MD5 ou SHA256) é suficiente para conferir o download, todavia se o usuário deseja fazer alterações menores ou auditar o conteúdo, o teste ilustra algumas opções simples de verificação:
head e tail do arquivo ou de trechos de cada grade
wc -l contando linhas do arquivo
grep de amostras específicas, selecionadas por gid.
Exemplos:
cd data
head grid_ibge_censo2010_info.csv
grep 5756000087008006 grid_ibge_censo2010_info.csv
wc -l grid_ibge_censo2010_info.csv
awk -F "," '/^[0-9]+0,/ {lines++; pop=pop+$2;} END{print lines, pop;}' grid_ibge_censo2010_info.csv
Os resultados do exemplo podem ser registrados com redirecionamento, por exemplo:
Complementando #1, também são necessários testes sobre o zip de distribuição. O teste de integridade (MD5 ou SHA256) é suficiente para conferir o download, todavia se o usuário deseja fazer alterações menores ou auditar o conteúdo, o teste ilustra algumas opções simples de verificação:
head
etail
do arquivo ou de trechos de cada gradewc -l
contando linhas do arquivogrep
de amostras específicas, selecionadas por gid.Exemplos:
Os resultados do exemplo podem ser registrados com redirecionamento, por exemplo:
Por fim, com
cat t.txt
visualizamos o resultado, e comdiff t.txt assert_csv_samples.txt
auditamos contra a última versão registrada no git.