osm-codes / BR_IBGE

Grade Estatística IBGE em Representação Compacta
http://git.osm.codes/BR_IBGE#readme
Apache License 2.0
2 stars 0 forks source link

Criar testes de terminal para conferir com diff #2

Closed ppKrauss closed 3 years ago

ppKrauss commented 3 years ago

Complementando #1, também são necessários testes sobre o zip de distribuição. O teste de integridade (MD5 ou SHA256) é suficiente para conferir o download, todavia se o usuário deseja fazer alterações menores ou auditar o conteúdo, o teste ilustra algumas opções simples de verificação:

Exemplos:

cd data
head grid_ibge_censo2010_info.csv
grep 5756000087008006  grid_ibge_censo2010_info.csv
wc -l grid_ibge_censo2010_info.csv
awk -F "," '/^[0-9]+0,/ {lines++; pop=pop+$2;} END{print lines, pop;}' grid_ibge_censo2010_info.csv

Os resultados do exemplo podem ser registrados com redirecionamento, por exemplo:

echo "=== Primeiras linhas do arquivo grid_ibge_censo2010_info.csv ===" > t.txt
head grid_ibge_censo2010_info.csv  >> t.txt
echo "=== grep ===" >> t.txt
grep 5756000087008006  grid_ibge_censo2010_info.csv  >> t.txt
echo "=== tot_lines ===" >> t.txt
wc -l grid_ibge_censo2010_info.csv  >> t.txt
echo "=== L0 lines and L0 tot_pop ===" >> t.txt
awk -F "," '/^[0-9]+0,/ {lines++; pop=pop+$2;} END{print lines, pop;}' grid_ibge_censo2010_info.csv  >> t.txt

Por fim, com cat t.txt visualizamos o resultado, e com diff t.txt assert_csv_samples.txt auditamos contra a última versão registrada no git.