turicas / covid19-br

Dados diários mais recentes do coronavírus por município brasileiro
https://brasil.io/dataset/covid19
GNU Lesser General Public License v3.0
530 stars 128 forks source link

Implementar script de coleta para AL #34

Open endersonmaia opened 4 years ago

endersonmaia commented 4 years ago

Temos microdados :

http://www.dados.al.gov.br/dataset/painel-covid19-alagoas

Segue link do CSV : http://www.dados.al.gov.br/dataset/painel-covid19-alagoas/resource/0371d543-3b57-4177-aea3-394d1f009bfd

--

A apuração para Alagoas está bem irregular em relação aos sites que disponibilizam os dados.

É possível encontrá-los em 3 endereços :

neste link existe uma seção Boletins, as vezes desatualizada com as notícias

neste link aparece junto com as notícias do site

aqui é o mais estruturado, contém uma lista de links para os boletins em PDF a partir do boletim de número 16

Segue o link de um PDF para tomar como referência : http://www.saude.al.gov.br/wp-content/uploads/2020/04/Informe-COVID-19-nº-27-02-DE-ABRIL-02_04_2020.pdf.pdf.pdf

mojimi commented 4 years ago

Não entendi o uso do script, o que ele deveria fazer? Quais os passos?

endersonmaia commented 4 years ago

Não entendi o uso do script, o que ele deveria fazer? Quais os passos?

baixar o PDF e tentar extrair os dados de forma automatizada, e gerar os dados, assim como outros script do repositório já estão fazendo ou tem PR abertas para fazer

vide : https://github.com/turicas/covid19-br/blob/master/corona_pr_spider.py

endersonmaia commented 4 years ago

Até a nomenclatura dos arquivos não tem padrão, não ajuda 😞

estes são os disponíveis no site do IFAL

informe-covid-19-no-15-20-de-marco-16h-50.pdf
informe-covid-19-no-16-21-de-marco-16h-29-pdf.pdf
informe-covid-19-no-17-22-de-marco17h-51-1.pdf
informe-covid-19-n-18-23-marco-17h-29-pdf-pdf.pdf
endersonmaia commented 4 years ago

O PDF deu uma estabilizada desde o boletim do dia 29/03/2020, existe agora uma tabela com os casos, dia a dia, por município.

endersonmaia commented 4 years ago

O PDF do Boletim parou de exibir a tabela com os casos por municipio desde o dia 08/04/2020.

Agora só tem informação textual, e a situação de casos suspeitos e descartados, em uma tabela que não dá pra inferir os casos confirmados.

http://www.saude.al.gov.br/wp-content/uploads/2020/04/Informe-COVID-19-nº-33-08-DE-ABRIL.pdf

endersonmaia commented 4 years ago

como comentei em https://github.com/turicas/covid19-br/issues/19#issuecomment-619443790 o boletim voltou a exibir tabela

endersonmaia commented 4 years ago

O CSV disponível em https://envio.seplag.al.gov.br/covid19/public/dados/sintomas tem um pouco de atraso em relação aos Boletins, mas por ser estruturado permite automatizar.

endersonmaia commented 4 years ago

O CSV disponível em https://envio.seplag.al.gov.br/covid19/public/dados/sintomas tem um pouco de atraso em relação aos Boletins, mas por ser estruturado permite automatizar.

parece que as atualizações estão bem mais frequentes, e agora pode ser que esteja até mais adiantado que os boletins divulgados em PDF