pcm-dpc / COVID-19

COVID-19 Italia - Monitoraggio situazione
Other
3.86k stars 2.24k forks source link

GIS Dashoard personalizzate - Necessità della colonna popolazione residente nei file CSV per la normalizzazione #842

Open lvalanzano opened 4 years ago

lvalanzano commented 4 years ago

Per chi è interessato ai sistemi GIS, ho realizzato un HUB Dashboard che raccoglie diverse mappature dei dati che diffondete su github in formato CSV. In realtà ho impostato un sistema a cascata tale che aggiornando 5 layers mi aggiorna tutte le Webmap realizzate, questi file sono open e chiunque può scaricarli liberamente dal portale ArcGIS Online utilizzandoli sia in ArGIS Online che importandoli in sistemi GIS Desktop.

Ne approfitto per esprimere una richiesta: “È possibile aggiungere una colonna con la popolazione residente del territorio relativo ad ogni riga nei file CSV provinciali, regionali e nazionali?” Potrebbe automatizzare le operazioni di normalizzazione dei dati sulla popolazione residente.

Un determinato numero di casi positivi in Puglia (844 casi positivi su 4 milioni di abitanti circa) non ha lo stesso peso in una regione come la Sardegna (789 casi positivi su 1,63 milioni di abitanti circa). Infatti, considerando la popolazione residente, il dato della Sardegna (48 casi ogni 100.000 abitanti) è più del doppio di quello della Puglia (21 casi ogni 100.000 abitanti).

I due link seguenti sono delle HUB dashboard che ho realizzato e per le quali potrebbero essere molto utili i dati sulla popolazione residente per normalizzare i valori rappresentati:

A - COVID19 – Monitoraggio della diffusione del virus in Campania e in Italia. https://covid19-ost-unisa.hub.arcgis.com/

B - COVID19 - Nove indicatori per il monitoraggio sulla diffusione del virus. https://ost-unisa.maps.arcgis.com/apps/MapSeries/index.html?appid=274f9f44dad94f60819115389a88e8e7

di seguito invece i 5 layers base che aggiorno quotidianamente importando i relativi file CSV sito GITHUB gestito da voi:

1 - COVID19 dati provinciali Italia - OST UNISA - aggiornata quotidianamente https://www.arcgis.com/home/item.html?id=1bb7a2da565a44ed89b4a217fb6215e5

2 - COVID19 dati provinciali ITALIA dal 24 febbraio ad oggi - OST UNISA - aggiornata quotidianamente https://www.arcgis.com/home/item.html?id=ed642f4422df428184571b844d05bced

3 - COVID19 dati regionali ITALIA - OST UNISA - aggiornata quotidianamente https://www.arcgis.com/home/item.html?id=45ff8a28e9994f2caf55a11dfc299e5d

4 - COVID19 dati regionali ITALIA dal 24 febbraio ad oggi - OST UNISA - aggiornata quotidianamente https://www.arcgis.com/home/item.html?id=e3b3690eee754234ad268e75785a6d8d

5 - COVID19 - Andamento Nazionale dal 24/2/2020 ad oggi - OST UNISA - aggiornata quotidianamente https://www.arcgis.com/home/item.html?id=dfa68def78cb48b7a00e27c20894b242

umbros commented 4 years ago

Ciao @lvalanzano e ti ringrazio per il bel lavoro, riguardo la popolazione residente utilizzando il csv campi interoperabili (codice regione, provincia, comune) è possibile utilizzarli per associarli a base dati per ulteriori studi e approfondimenti.

lvalanzano commented 4 years ago

si,grazie del consiglio, ma per una questione di automatismi operazionali, il file CSV non può essere unito (JOIN) nella piattaforma ArsGIS Online.
La mia richiesta voleva essere una sorta di consiglio per migliorare il file. Effettivamente bisogna sempre mitigare due necessità, la completezza dei dati e il modo più snello di distribuirli. aggiungere la colonna popolazione potrebbe appesantire il processo ma se c'è la possibilità di aggiungere tale colonna credo che la cosa potrebbe far piacere a molte persone.

Grazie ancora per quello che fate. Buon Lavoro

lvalanzano commented 4 years ago

Dimenticavo di allegare anche il link diretto alle due Dashboard principali.

C - Italia - Dashboard 1 - Evoluzione del COVID19 in Italia e impatto sulle strutture di terapia intensiva https://www.arcgis.com/apps/dashboards/db61ba13d4124b30a4e97a8fd9052941

D - Campania - Dashboard 2 - Evoluzione del COVID19 in Campania e impatto sulle strutture di terapia intensiva https://www.arcgis.com/apps/opsdashboard/index.html#/c4d664fc5efd4d49a9f27e14b1150c6c

mrizzato commented 3 years ago

È stato fatto qualcosa per il campo popolazione residente? Mi piacerebbe che fosse possibile stabilire a quale dato si riferisce la EU (ECDC) nel reporting dei casi normalizzati a 100000 abitanti sia a livello nazionale che regionale (https://www.ecdc.europa.eu/en/publications-data/weekly-subnational-14-day-notification-rate-covid-19)

Loro riferiscono di utilizzare il link

https://www.arcgis.com/apps/opsdashboard/index.html#/b0c68bce2cce478eaac82fe38d4138b1

come data source per i loro dati (vedi https://www.ecdc.europa.eu/en/publications-data/sources-eueea-regional-data-covid-19), ma né a tale link (che fa riferimento a questo repository github, ovviamente, come backend dati), né in qui in github, si trovano i dati normalizzati a 100000 abitanti già disponibili o il riferimento per il dato di popolazione da utilizzare per la normalizzazione, e questo sia per i dati nazionali che per quelli regionalizzati (provincie/regioni).

Trovo che lasciare che l'ECDC (Europa) si faccia i conti da sè utilizzando dati di popolazione residente che non siano sotto il controllo di un ente Italiano sia quanto meno un contributo all'opacità dei dati disponibili.

mrizzato commented 3 years ago

È stato fatto qualcosa per il campo popolazione residente? Mi piacerebbe che fosse possibile stabilire a quale dato si riferisce la EU (ECDC) nel reporting dei casi normalizzati a 100000 abitanti sia a livello nazionale che regionale (https://www.ecdc.europa.eu/en/publications-data/weekly-subnational-14-day-notification-rate-covid-19)

Loro riferiscono di utilizzare il link

https://www.arcgis.com/apps/opsdashboard/index.html#/b0c68bce2cce478eaac82fe38d4138b1

come data source per i loro dati (vedi https://www.ecdc.europa.eu/en/publications-data/sources-eueea-regional-data-covid-19), ma né a tale link (che fa riferimento a questo repository github, ovviamente, come backend dati), né in qui in github, si trovano i dati normalizzati a 100000 abitanti già disponibili o il riferimento per il dato di popolazione da utilizzare per la normalizzazione, e questo sia per i dati nazionali che per quelli regionalizzati (provincie/regioni).

Trovo che lasciare che l'ECDC (Europa) si faccia i conti da sè utilizzando dati di popolazione residente che non siano sotto il controllo di un ente Italiano sia quanto meno un contributo all'opacità dei dati disponibili.

Ho fatto un reverse engineering dei dati dell'ECDC. Risultato: usano il dato di popolazione al 01.01.2019 registrato dall'Eurostat (https://ec.europa.eu/eurostat/estat-navtree-portlet-prod/BulkDownloadListing?file=data/demo_r_d2jan.tsv.gz). Riferimento per i dati regionali sono i codici NUTS2 (e.g. Veneto=ITH3).