L’esigenza di avere un dataset in cui vengano registrati i valori relativi all’epidemia COVID-19 in Sicilia dettagliato per province nasce dalla mancanza di un tale dataset nel repo del Dipartimento della Protezione Civile, dove i dati disaggregati per provincia riguardano soltanto il campo “totale_casi”, e dalla mancanza di disponibilità di tali dati da parte della Regione Siciliana.
Per essere più precisi, la Regione Siciliana pubblica quotidianamente (in prosa e per immagini) un comunicato in cui vengono riportati alcuni valori che riguardano l’epidemia COVID-19 in Sicilia, avvisando che sono i valori comunicati al Dipartimento di Protezione Civile ma non rende appunto disponibile un dataset che elenchi l’insieme di questi dati comunicati quotidianamente.
Il 23 marzo 2020 abbiamo scritto una lettera aperta (e inviato una richiesta via email) alla Regione Siciliana, per chiedere che questi dati fossero pubblicati anche in modalità machine readable, anche come tabelle. Ad oggi nessuna risposta.
Cogliamo pertanto l'occasione per rinnovare il nostro invito alla Regione Siciliana di rendere disponibili dati di maggior dettaglio.
Questo dataset è quindi il frutto della raccolta dei dati pubblicati dalla Regione Siciliana e ha lo scopo di consentirne la loro analisi per ciascuna provincia siciliana andando a colmare un’importante lacuna.
I dati dettagliati per provincia pubblicati dalla Regione Siciliana non coprono tutte le informazioni: alcuni valori vengono forniti come dato regionale complessivo. È il caso, ad esempio, del numero di pazienti ricoverati in terapia intensiva (campo terapia_intensiva
) e del numero dei “tamponi” effettuati.
Per quanto riguarda il numero dei pazienti in isolamento domiciliare (campo isolamento_domiciliare
) sebbene la Regione Siciliana lo fornisca come totale regionale è possibile ricavarne il valore dettagliato per provincia sottraendo il valore dei ricoverati (campo totale_ospedalizzati
) dal valore del totale positivi
(precedentemente totale_attualmente_positivi
):
isolamento_domiciliare = totale_positivi - totale_ospedalizzati
I dati al momento sono 👉 disponibili QUI in formato CSV
(encoding UTF-8
e ,
come separatore), con un file di insieme che contiene tutti i dati. E qui in JSON.
Si possono visualizzare anche tramite questo foglio elettronico, che per noi vale soltanto come risorsa di lavoro. I dati "veri" sono quelli del suddetto CSV.
E infine sono accessibili anche in questo dataset su data.world.
Se usi questi dati, indicalo per favore in qesta modalità:
COVID-19, Sicilia - Fonte: Repository di Open Data Sicilia con dati pubblicati dalla Regione Siciliana e dal Dipartimento Protezione Civile. Licenza CC BY 4.0
Qui il codice HTML che puoi incollare nel tuo sito/mappa/dashboard;
<b>COVID-19, Sicilia</b> - Fonte: <a target="_blank" href='https://github.com/opendatasicilia/COVID-19_Sicilia' target='_blank'>Repository di Open Data Sicilia</a>
con dati pubblicati dalla Regione Siciliana e dal Dipartimento Protezione Civile.
Licenza <a target="_blank" href="https://creativecommons.org/licenses/by/4.0/deed.it">CC BY 4.0</a>
Riportiamo qui di seguito il significato della tipologia dei valori esposti e le formule con cui vengono ricavati i valori totali.
Abbiamo utilizzato lo stesso schema che il Dipartimento della Protezione Civile usa per le regioni, in modo da essere uniformi e per allinearci a un insieme più ricco di dati (lo schema per province del DPC infatti contiene al momento soltanto il totale).
ricoverati con sintomi
; si tratta dei pazienti affetti da Covid-19 ricoverati ma non in terapia intensiva. Non è stato possibile ricavare i dati disaggregati per provincia.terapia_intensiva
; si tratta dei pazienti affetti da Covid-19 ricoverati in terapia intensiva. Non è stato possibile ricavare i dati disaggregati per provincia. Il dato comunicato riguarda il totale regionale.totale_ospedalizzati
= ricoverati_con_sintomi
+ terapia_intensiva` ; valore comunicato dalla Regione Siciliana dettagliato per ciascuna provincia.isolamento_domiciliare
; si tratta dei pazienti affetti da Covid-19 ma non ricoverati. Il dato non viene comunicato dalla Regione Siciliana dettagliatamente per provincia ma si ottiene sottraendo il totale_ospedalizzati
dal totale_positivi
(si veda sopra).totale_positivi
= totale_ospedalizzati
+ isolamento_domiciliare
; il dato è comunicato dalla Regione Siciliana dettagliato per ciascuna provincia.variazione_totale_positivi
= totale_positivi
del giorno corrente - totale_positivi
del giorno precedente. Si tratta di un valore calcolato.nuovi_positivi
= totale_casi
del giorno corrente - totale_casi
del giorno precedente. Si tratta di un valore calcolato e misura l’espandersi dell’epidemia.dimessi_guariti
; si tratta dei paziendi dimessi o guariti; valore comunicato dalla Regione Siciliana dettagliato per ciascuna provincia.deceduti
; si tratta dei pazienti deceduti; valore comunicato dalla Regione Siciliana dettagliato per ciascuna provincia.totale_casi
= totale_positivi
+ dimessi_guariti
+ deceduti
; si tratta del totale dei pazienti che hanno contratto il contagio indipendentemente che siano ancora in cura, che siano guariti o deceduti. Questo dato, che rappresenta un valore calcolato, veniva inizialmente comunicato dalla Regione Siciliana dettagliato per ciascuna provincia; attualmente è rinvenibile come unico dato provinciale comunicato dal Dipartimento della Protezione Civile.tamponi
; non è stato possibile ricavare i dati disaggregati per provincia poiché il dato comunicato dalla Regione Siciliana riguarda il totale regionale.La rilevazione dei dati presenti nel nostro dataset è stata oggetto di controlli di consistenza dei dati stessi e che per i primi giorni, sostanzialmente dal 24/02/2020 al 05/03/2020, data in cui la Regione Siciliana ha iniziato a pubblicare regolarmente i propri comunicati, è stato necessario effettuare ulteriori verifiche sulle notizie di stampa locali per integrare correttamente alcuni dati mancanti (quelli riguardanti guariti_dimessi e deceduti) e associarli alla relativa provincia.
Dai controlli effettuati sono stati rilevati alcuni casi (5 alla data del 03/04/2020) in cui si sospetta dell’accuratezza dei dati esposti.
OpenDataSicilia ha raccolto in 👉 questa pagina alcune visualizzazioni di base sulla COVID-19 per la Sicilia, in modo che possano essere usate in qualsiasi altro sito, con un semplice CTRL+C, CTRL+V (un copia e incolla 😊).
Usando il modello RDF Data Cube Vocabulary sono state create le dimensioni, le misure e gli attributi necessari per descrivere in linguaggio semantico il dataset del monitoraggio sanitario COVID-19, motivo per cui tali dati sono fruibili anche tramite SPARQL endpoint. I dati sono aggiornati quotidianamente.
URI
secondo il seguente schema:http://www.opendatasicilia.it/dataset/covid19/sicilian-trend/observations/20200408/regions/19/provinces/088
Nome | Property |
---|---|
Data | http://purl.org/linked-data/sdmx/2009/dimension#refTime |
Area geografica | http://purl.org/linked-data/sdmx/2009/dimension#refArea |
Nome | Property |
---|---|
Totale ospedalizzati | http://www.protezionecivile.gov.it/ns/totalHospitalized |
Isolamento domiciliare | http://www.protezionecivile.gov.it/ns/homeIsolation |
Totale positivi | http://www.protezionecivile.gov.it/ns/totalPositive |
Variazione totale positivi | http://www.protezionecivile.gov.it/ns/totalPositiveVariation |
Nuovi positivi | http://www.protezionecivile.gov.it/ns/newPositive |
Dimessi guariti | http://www.protezionecivile.gov.it/ns/healed |
Deceduti | http://www.protezionecivile.gov.it/ns/deads |
Totale casi | http://www.protezionecivile.gov.it/ns/totalCases |
L'istanza relativa alla dimensione dell'area geografica (province) è stata presa dal progetto Ontopia, nella fattispecie dal vocabolario controllato della classificazione territoriale:
<https://w3id.org/italia/controlled-vocabulary/territorial-classifications/provinces/083>
Quali sono i dati sanitari della provincia di Messina del 25 marzo 2020?
Per motivi di performance sono stati caricati nello store anche i vocabolari controllati di Ontopia.
PREFIX qb: <http://purl.org/linked-data/cube#>
PREFIX sdmx-dimension: <http://purl.org/linked-data/sdmx/2009/dimension#>
PREFIX dpc: <http://www.protezionecivile.gov.it/ns/>
prefix l0: <https://w3id.org/italia/onto/l0/>
SELECT ?areaName ?date
?totalPositive ?homeIsolation
?newPositive ?totalPositiveVariation
?healed ?deads ?totalCases
WHERE
{
?obs a qb:Observation;
qb:dataset <http://www.opendatasicilia.it/dataset/covid19/sicilian-trend>;
sdmx-dimension:refTime ?date;
sdmx-dimension:refArea ?area;
dpc:homeIsolation ?homeIsolation ;
dpc:totalPositive ?totalPositive ;
dpc:newPositive ?newPositive ;
dpc:totalCases ?totalCases ;
dpc:totalPositiveVariation ?totalPositiveVariation ;
dpc:deads ?deads ;
dpc:healed ?healed .
?area l0:name ?areaName.
FILTER regex(?areaName,"^Messina","i").
FILTER(?date = "2020-03-25"^^xsd:date).
}
E' stata creata un'applicazione android per consentire la visualizzazione dei dati anche da cellulare in modo semplice e intuitivo.
L'applicazione raccoglie i dati dal file JSON di Open Data Sicilia.
Di seguito alcuni screeshots.
La nostra comunità (Open Data Sicilia), consapevole dell’importanza di disporre in maniera organica, strutturata (machine readable) e aperta (dati resi disponibili con licenza aperta, open data) della maggior quantità e tipologia possibile di dati riguardanti l’epidemia COVID-19 in Sicilia, ha indirizzato alle autorità regionali una lettera aperta con la quale chiede il rilascio degli stessi in tali modalità e la loro integrazione con ulteriori dati (ad esempio dati dettagliati per comuni, per sesso, per età, ecc.), che consentano una completa analisi del fenomeno in Sicilia, offrendo al contempo la propria disponibilità a supportare l’amministrazione nel rendere gli stessi disponibili alla più amplia platea di soggetti interessati (ricercatori, giornalisti, data scientist, semplici cittadini, ecc.).
In attesa di una risposta, Open Data Sicilia ha deciso di rendere intanto disponibile quanto finora raccolto.
Questo lavoro non ci sarebbe stato senza il forte stimolo inziale e il tempo dedicato di Nino Galante e Totò Fiandaca, il supporto e il coordinamento di Andrea Borruso; a loro va il nostro ringraziamento.