Closed jtrecenti closed 4 years ago
Obrigada Julio, vamos testar e incorporar!
Oi, agora dá para extrair a série histórica diretamente em CSV pelo site, mas parece que a URL muda todo dia... a ver se segue algum padrão: http://covid.saude.gov.br/
sim, obrigada! estávamos fazendo o download diário para poder manter o histórico e hoje eles mudaram isso... vamos ver como fica amanhã. mas estamos mexendo para a função puxar diretamente o csv. só falta ver se fica estável ;)
@jtrecenti e @belisards, vocês conseguiram captar automaticamente a url do csv de hoje?
Não sei se estou pensando de forma muito simplista, mas isso aqui foi suficiente pra mim!
httr::GET(sprintf("https://covid.saude.gov.br/assets/files/COVID19_%s.csv", format(Sys.Date(), "%Y%m%d")))
talvez assim tbm, sem precisar usar datas...
path_file <- "https://covid.saude.gov.br/14-es2015.5904e62a87702c6e2c79.js" %>%
httr::GET() %>%
httr::content("text", encoding = "latin1") %>%
stringr::str_extract("(?<=href=\")[a-z/]+COVID19_.*\\.csv")
httr::GET(paste0("https://covid.saude.gov.br", path_file))
perfeito! estava presa no json mas isso resolve. Vamos ver como fica amanhã
@jtrecenti, vamos incluí-lo como contributor do nosso pacote, tudo bem para você?
Claro, valeu :)))
Parece que é possível extrair os dados do novo portal (covid.saude.gov.br) rodando
A estrutura de dados é diferente, então pode ser difícil adaptar o pacote.
Também não sei se a application ID pode mudar de tempos em tempos, e não encontrei um jeito fácil de obtê-lo dinamicamente.