opendatasicilia / COVID-19_Sicilia

Un repository per raccogliere i dati sulla COVID-19, che la Regione Siciliana pubblica in prosa e per immagini
https://opendatasicilia.github.io/COVID-19_Sicilia
Creative Commons Attribution 4.0 International
2 stars 3 forks source link

Perché questo spazio

L’esigenza di avere un dataset in cui vengano registrati i valori relativi all’epidemia COVID-19 in Sicilia dettagliato per province nasce dalla mancanza di un tale dataset nel repo del Dipartimento della Protezione Civile, dove i dati disaggregati per provincia riguardano soltanto il campo “totale_casi”, e dalla mancanza di disponibilità di tali dati da parte della Regione Siciliana.
Per essere più precisi, la Regione Siciliana pubblica quotidianamente (in prosa e per immagini) un comunicato in cui vengono riportati alcuni valori che riguardano l’epidemia COVID-19 in Sicilia, avvisando che sono i valori comunicati al Dipartimento di Protezione Civile ma non rende appunto disponibile un dataset che elenchi l’insieme di questi dati comunicati quotidianamente.

Il 23 marzo 2020 abbiamo scritto una lettera aperta (e inviato una richiesta via email) alla Regione Siciliana, per chiedere che questi dati fossero pubblicati anche in modalità machine readable, anche come tabelle. Ad oggi nessuna risposta.
Cogliamo pertanto l'occasione per rinnovare il nostro invito alla Regione Siciliana di rendere disponibili dati di maggior dettaglio.

Scopo

Questo dataset è quindi il frutto della raccolta dei dati pubblicati dalla Regione Siciliana e ha lo scopo di consentirne la loro analisi per ciascuna provincia siciliana andando a colmare un’importante lacuna.
I dati dettagliati per provincia pubblicati dalla Regione Siciliana non coprono tutte le informazioni: alcuni valori vengono forniti come dato regionale complessivo. È il caso, ad esempio, del numero di pazienti ricoverati in terapia intensiva (campo terapia_intensiva) e del numero dei “tamponi” effettuati.

Per quanto riguarda il numero dei pazienti in isolamento domiciliare (campo isolamento_domiciliare) sebbene la Regione Siciliana lo fornisca come totale regionale è possibile ricavarne il valore dettagliato per provincia sottraendo il valore dei ricoverati (campo totale_ospedalizzati) dal valore del totale positivi (precedentemente totale_attualmente_positivi):

isolamento_domiciliare = totale_positivi - totale_ospedalizzati

Dati

I dati al momento sono 👉 disponibili QUI in formato CSV (encoding UTF-8 e , come separatore), con un file di insieme che contiene tutti i dati. E qui in JSON.

Si possono visualizzare anche tramite questo foglio elettronico, che per noi vale soltanto come risorsa di lavoro. I dati "veri" sono quelli del suddetto CSV.

E infine sono accessibili anche in questo dataset su data.world.

Se usi questi dati

Se usi questi dati, indicalo per favore in qesta modalità:

COVID-19, Sicilia - Fonte: Repository di Open Data Sicilia con dati pubblicati dalla Regione Siciliana e dal Dipartimento Protezione Civile. Licenza CC BY 4.0

Qui il codice HTML che puoi incollare nel tuo sito/mappa/dashboard;

<b>COVID-19, Sicilia</b> - Fonte: <a target="_blank" href='https://github.com/opendatasicilia/COVID-19_Sicilia' target='_blank'>Repository di Open Data Sicilia</a>
con dati pubblicati dalla Regione Siciliana e dal Dipartimento Protezione Civile.
Licenza <a target="_blank" href="https://creativecommons.org/licenses/by/4.0/deed.it">CC BY 4.0</a>

Schema dati

Riportiamo qui di seguito il significato della tipologia dei valori esposti e le formule con cui vengono ricavati i valori totali.

Abbiamo utilizzato lo stesso schema che il Dipartimento della Protezione Civile usa per le regioni, in modo da essere uniformi e per allinearci a un insieme più ricco di dati (lo schema per province del DPC infatti contiene al momento soltanto il totale).

Controlli effettuati sui dati

La rilevazione dei dati presenti nel nostro dataset è stata oggetto di controlli di consistenza dei dati stessi e che per i primi giorni, sostanzialmente dal 24/02/2020 al 05/03/2020, data in cui la Regione Siciliana ha iniziato a pubblicare regolarmente i propri comunicati, è stato necessario effettuare ulteriori verifiche sulle notizie di stampa locali per integrare correttamente alcuni dati mancanti (quelli riguardanti guariti_dimessi e deceduti) e associarli alla relativa provincia.
Dai controlli effettuati sono stati rilevati alcuni casi (5 alla data del 03/04/2020) in cui si sospetta dell’accuratezza dei dati esposti.

Raccolta visualizzazioni di base, per la Sicilia

OpenDataSicilia ha raccolto in 👉 questa pagina alcune visualizzazioni di base sulla COVID-19 per la Sicilia, in modo che possano essere usate in qualsiasi altro sito, con un semplice CTRL+C, CTRL+V (un copia e incolla 😊).

Semantic Web

Usando il modello RDF Data Cube Vocabulary sono state create le dimensioni, le misure e gli attributi necessari per descrivere in linguaggio semantico il dataset del monitoraggio sanitario COVID-19, motivo per cui tali dati sono fruibili anche tramite SPARQL endpoint. I dati sono aggiornati quotidianamente.

http://www.opendatasicilia.it/dataset/covid19/sicilian-trend/observations/20200408/regions/19/provinces/088

Dimensioni

Nome Property
Data http://purl.org/linked-data/sdmx/2009/dimension#refTime
Area geografica http://purl.org/linked-data/sdmx/2009/dimension#refArea

Misurazioni

Nome Property
Totale ospedalizzati http://www.protezionecivile.gov.it/ns/totalHospitalized
Isolamento domiciliare http://www.protezionecivile.gov.it/ns/homeIsolation
Totale positivi http://www.protezionecivile.gov.it/ns/totalPositive
Variazione totale positivi http://www.protezionecivile.gov.it/ns/totalPositiveVariation
Nuovi positivi http://www.protezionecivile.gov.it/ns/newPositive
Dimessi guariti http://www.protezionecivile.gov.it/ns/healed
Deceduti http://www.protezionecivile.gov.it/ns/deads
Totale casi http://www.protezionecivile.gov.it/ns/totalCases

L'istanza relativa alla dimensione dell'area geografica (province) è stata presa dal progetto Ontopia, nella fattispecie dal vocabolario controllato della classificazione territoriale:

<https://w3id.org/italia/controlled-vocabulary/territorial-classifications/provinces/083>

Esempio SPARQL

Demo

PREFIX qb: <http://purl.org/linked-data/cube#>
PREFIX sdmx-dimension: <http://purl.org/linked-data/sdmx/2009/dimension#>
PREFIX dpc: <http://www.protezionecivile.gov.it/ns/>
prefix l0: <https://w3id.org/italia/onto/l0/>

SELECT ?areaName ?date
       ?totalPositive ?homeIsolation
       ?newPositive ?totalPositiveVariation
       ?healed ?deads ?totalCases
WHERE
{
    ?obs a qb:Observation;
         qb:dataset <http://www.opendatasicilia.it/dataset/covid19/sicilian-trend>;
         sdmx-dimension:refTime ?date;
         sdmx-dimension:refArea ?area;
         dpc:homeIsolation ?homeIsolation ;
         dpc:totalPositive ?totalPositive ;
         dpc:newPositive ?newPositive ;
         dpc:totalCases ?totalCases ;
         dpc:totalPositiveVariation ?totalPositiveVariation ;
         dpc:deads ?deads ;
         dpc:healed ?healed .
         ?area l0:name ?areaName.
         FILTER regex(?areaName,"^Messina","i").
         FILTER(?date = "2020-03-25"^^xsd:date).
}

Applicazione Android

E' stata creata un'applicazione android per consentire la visualizzazione dei dati anche da cellulare in modo semplice e intuitivo. L'applicazione raccoglie i dati dal file JSON di Open Data Sicilia.
Di seguito alcuni screeshots.

screen-1 screen-1

LINK DOWNLOAD

Lettera aperta

La nostra comunità (Open Data Sicilia), consapevole dell’importanza di disporre in maniera organica, strutturata (machine readable) e aperta (dati resi disponibili con licenza aperta, open data) della maggior quantità e tipologia possibile di dati riguardanti l’epidemia COVID-19 in Sicilia, ha indirizzato alle autorità regionali una lettera aperta con la quale chiede il rilascio degli stessi in tali modalità e la loro integrazione con ulteriori dati (ad esempio dati dettagliati per comuni, per sesso, per età, ecc.), che consentano una completa analisi del fenomeno in Sicilia, offrendo al contempo la propria disponibilità a supportare l’amministrazione nel rendere gli stessi disponibili alla più amplia platea di soggetti interessati (ricercatori, giornalisti, data scientist, semplici cittadini, ecc.).
In attesa di una risposta, Open Data Sicilia ha deciso di rendere intanto disponibile quanto finora raccolto.

Ringraziamenti

Questo lavoro non ci sarebbe stato senza il forte stimolo inziale e il tempo dedicato di Nino Galante e Totò Fiandaca, il supporto e il coordinamento di Andrea Borruso; a loro va il nostro ringraziamento.

Chi usa o è ispirato dal nostro progetto