liibre / coronabr

Pacote para fazer o download dos casos diários de coronavirus no Brasil desde diferentes fontes
https://liibre.github.io/coronabr/
51 stars 14 forks source link

Fonte do site do Min. da Saúde mudou #27

Closed Freguglia closed 4 years ago

Freguglia commented 4 years ago

Oi pessoal, estou mantendo um outro pacote apenas para importação dos dados (Ministério da Saúde, Brasil.io, CSSE da Johns Hopkins e vou adicionando conforme encontrar mais) em Freguglia/datacovidbr, sem nenhum tipo de análise pra minimizar o número de dependências.

Hoje o jeito que eu usava para importar os dados do ministério da saúde parou de funcionar (colocar a data de trás pra frente no nome do arquivo a cada dia), e acredito que o do coronabr (aqui) também era isso.

Eu consegui consertar ele aqui, se quiserem aproveitar pra não gastar muito tempo olhando coisas em javascript, o endereço para o arquivo .csv do dia fica em

  library(httr)
  library(magrittr)
  link <- GET("https://xx9p7hp1p7.execute-api.us-east-1.amazonaws.com/prod/PortalGeral",
              add_headers("X-Parse-Application-Id" = 
                            "unAFkcaNDeXajurGB7LChj8SgQYS2ptm")) %>%
    content() %>%
    '[['("results") %>%
    '[['(1) %>%
    '[['("arquivo") %>%
    '[['("url")

Posso escrever pra vocês sempre que notar uma mudança drástica ou também se quiserem utilizar o outro pacote para a parte da importação podemos ir coordenando.

Victor.

AndreaSanchezTapia commented 4 years ago

Obrigada Victor, e parabéns pelo pacote

percebemos que o ministério mudou o padrão (de novo), mesmo que a url pro GET seja a mesma que o @jtrecenti tinha encontrado para a versão anterior do site.

Na mudança mais recente as datas estão vindo no padrão de cinco números do Excel (com a origem dia 01/01/1900). Dá para corrigir isto com julian() e a origem que o Excel usa, mas é bem capaz de voltar a mudar, então desta vez vamos esperar um par de dias ¬¬

Freguglia commented 4 years ago

Esse padrão de data mudaram no arquivo das 17h de hoje pelo jeito, porque durante a tarde ainda estava funcionando :(

Como preciso manter sempre o outro repo atualizado porque tem gente usando pra trabalhar na modelagem, eu vou tentar ir acompanhando as mudanças que eles fazem na API. Se ficar uma coisa consistente por alguns dias eu mando um PR no branch daqui com a versão mais recente funcionando :)

Vou fechar aqui por enquanto.