montera34 / escovid19data

Recopilación de datos de COVID19 por provincias en España
Other
81 stars 23 forks source link

Diferencia entre los datos notificados de Comunidad Valenciana, Murcia y Andalucía #33

Open mangelmyts opened 3 years ago

mangelmyts commented 3 years ago

Buenas tardes. Consultando las presentaciones de datos, veo que la "clasificación" de IA14 por CCAA (https://lab.montera34.com/covid19-r/reports/tablas-escovid19data.html#ia14-por-ccaa) discrepa de forma importante con la que se puede obtener de la tabla ministerial del informe de hoy (https://www.mscbs.gob.es/en/profesionales/saludPublica/ccayes/alertasActual/nCov/documentos/Actualizacion_316_COVID-19.pdf). De este informe se desprende que, tras Melilla, es Madrid la comunidad con mayor IA14, mientras que en los datos del proyecto escovid19 citados más arriba, Comunidad Valenciana, Murcia y Andalucía superan a Madrid, algunas de forma importante.

Para ver dónde puede estar el problema, he investigado un poco en el caso de la Comunidad Valenciana. He consultado las tablas por provincias de escovid19, y efectivamente respaldan el resultado elevado. Sin embargo, buscando en la info he visto que los datos se obtienen de la información pública del Instituto Carlos III; al consultarlos (https://cnecovid.isciii.es/covid19/#documentaci%C3%B3n-y-datos) he visto, por el contrario, que estos datos respaldan la tabla ministerial, y coinciden con los que facilita la Generalitat. Hay un problema, por tanto, en el minado de datos, que otorga datos anormalmente altos en escovid19 al menos para la Comunidad Valenciana.

numeroteca commented 3 years ago

En el README explicamos que en nuestra base de datos que provienn de las CCAA también descargamos e integramos los datos de RENAVE ISCIII (en la variable num_casos). Sin embargo, los que usamos para calcular la IA14 son los de cases_accumulated que en el caso de la Comunidad Valenciana vienen de las notas de prensa de la Generalitat Valenciana (ver wiki https://github.com/montera34/escovid19data/wiki#comunidad-valenciana) y se guardan en la variable cases_accumulated ¿resuelve eso el problema?

jlluch commented 3 years ago

Los cálculos de IA14 del ISCIII, están sub representados debido a los retrasos en la adjudicación de cada caso a la fecha de diagnóstico, en la propia web del ISCIII se explica. En este tuit calculo el retraso que hay entre dos fechas y como afecta al cálculo de la IA: Link

mangelmyts commented 3 years ago

El tema de los retrasos, ciertamente, es muy importante. En su momento yo también lo analicé para poder calcular las tendencias a partir del IA7 en la serie de "Entornos COVID" que he estado publicando en la web AMYTS. Comparto totalmente que es un asunto a tener en cuenta, pero en el que las diferencias entre CCAA no justifican esa tremenda inversión de resultados que relato al inicio de este hilo. Trato más tarde de valorar la respuesta de numeroteca, por ver cómo aclarar la discrepancia de cifras. Gracias!