Data from the Spanish Health Ministry and other Spanish official sources of the for the covid-19 outbreak. All regions, most provinces included. Updated daily
Quiero agradeceros vuestro tiempo en recopilar los datos covid-19 por provincias. He intentado obtener los datos de las disintas páginas web de las Comunidades Autónomas y es una tarea difícil.
Me surge una duda, quizá esto ya esté suficientemente explicado, pero aún no lo comprendo.
Cuando reproduzco una serie temporal, por ejemplo Cádiz:
library(tidyverse)
data <- read_csv("~/gitrepos/covid-19-es/datos-provincias-csv/covid-19-ES-Provincias-datos_provincias.csv")
data %>%
filter(provincia_iso=="CA") %>%
ggplot(aes(fecha, num_casos)) + geom_line()
veo que el pico se alcanza a mediados de marzo, cuando en realidad los medios anunciaron dicho pico en la primera semana de abril.
Estaba utilizando datos del IECA (Instituto de Estadística y Cartografía de Andalucía) con fecha de notificación en lugar de fecha de comienzo de síntomas. Puede encontrase más información aquí y aquí
Quiero agradeceros vuestro tiempo en recopilar los datos covid-19 por provincias. He intentado obtener los datos de las disintas páginas web de las Comunidades Autónomas y es una tarea difícil.
Me surge una duda, quizá esto ya esté suficientemente explicado, pero aún no lo comprendo.
Cuando reproduzco una serie temporal, por ejemplo Cádiz:
veo que el pico se alcanza a mediados de marzo, cuando en realidad los medios anunciaron dicho pico en la primera semana de abril.
¿A qué se debe ese desplazamiento?