Estaba pendiente la duda sobre sobre si los datos de la columna "hospitalized" de cada día y para cada provincia:
incluían también los datos del número de personas que estaban en UCI (y que se incluían en la columna "intensive_care")
o bien, eran dos datos distintos: el número de personas "en planta" (que están ingresadas, pero no graves, afortunadamente) y el número de personas en UCI.
Problema: como se ofrecen los datos (y cómo los hemos compilado)
Los problemas eran varios:
Hay comunidades que sí explican claramente sus datos (ej: Cataluña, Ceuta...)
Hay CCAA que ofrecen sus datos separados (los hospitalizados no incluyen UCI) pero la madrina sí ofrecía la suma combinada en "hospitalized".
Ej: Madrid. Y tiene una explicación: por lo que comenta alfonsotwr en https://github.com/alfonsotwr/snippets/tree/master/covidia-cam:
"En la columna de hospitalizados_dia sumo los Hospitalizados ingresados en el día y los de la UCI ingresados en el día, tal como hacía el Ministerio de Sanidad en sus informes: entiendo que los Hospitalizados ingresados en el día de la Consejería de Salud no incluían a los de la UCI, mientras el Ministerio de Sanidad sí los incluye, por lo que he usado la convención del Ministerio de Sanidad en los ficheros de datos."
Otras CCAA no explicaban claramente en las fuentes que usábamos si había separación o no
Ej: Andalucía. Ha habido que revisar alguna otra fuente, como un tuit oficial de la Junta de Andalucía del día en curso, para confirmar que, en los datos que estamos usando, no hacen esa separación.
Otras CCAA (muchas de las que ofrecen notas de prensa) ofrecen el dato sumado de todos los hospitalizados (planta+UCI) y el dato de UCI, pero de forma clara puede realizarse la resta.
Ej.: Comunidad Valenciana, donde las notas de prensa incluyen referencias como: "159 en la provincia de Alicante, 30 de ellos en la UCI" (que suponen, pues, 129 hospitalizados en planta"
y, para cada CCAA, las fuentes que ha usado cada madrina (y alguna otra, para confirmar, en algunos casos), teniendo en cuenta al menos todos los casos mencionados.
El resumen, en forma de tabla (copia de la que está en la hoja de Drive es este, donde:
SI = Los datos de "hospitalizados" están separados de UCI (no los incluyen, solo son datos de planta).
NO = Los datos de "hospitalizados" INCLUYEN los datos de UCI
En el apartado "Documentación", https://dadescovid.cat/documentacio?lang=cas , se especifica: "Estos pacientes están incluidos entre los ingresados pero en los días previos (para ingresar en la UCI se tiene que haber ingresado previamente en el hospital)." Luego, se entiende que, en los datos de un día en particular, los UCI NO están incluídos en hospitalizados.
Pregunta
Estaba pendiente la duda sobre sobre si los datos de la columna "hospitalized" de cada día y para cada provincia:
Problema: como se ofrecen los datos (y cómo los hemos compilado)
Los problemas eran varios:
Revisión y resumen: situación actual
Se han revisado todas las CCAA, comparando:
El resumen, en forma de tabla (copia de la que está en la hoja de Drive es este, donde: