NOTA BENE: dopo l'annuncio del repository ufficiale della Protezione Civile con i dati sul COVID-19, abbiamo bloccato l'aggiornamento automatico dei dati a partire dai PDF pubblicati sul loro sito.
Alla data del 4 marzo 2020 - dopo circa 15 giorni dal primo caso "italiano" - non c'è in Italia una fonte ufficiale che pubblichi i dati in modalità machine readable.
Questo repository sarà aggiornato una volta al giorno - intorno alle 19:30 - per scaricare dal sito della Protezione Civile i 2 file PDF denominati Dati di riepilogo nazionale (pdf)
e Dettaglio per provincia (pdf)
e trasformarli in formati leggibili da una "macchina".
I file sono aggiornati dalla Protezione Civile ogni giorno intorno alle 18:00.
Sul numero di deceduti la Protezione Civile riporta che "potrà essere confermato solo dopo che l’Istituto Superiore di Sanità avrà stabilito la causa effettiva del decesso".
Questo sistema potrebbe smettere di funzionare da subito, dopo una modifica effettuata dai gestori del sito della Protezione Civile.
Questa è l'occasione per chiedere anche noi al Ministero della Sanità e alla Protezione Civile di produrre - oltre a questi necessari file PDF pensati per fare la dovuta e utile rassegna stampa - dei file e/o dei servizi in formato machine readable, con licenza aperta, certificati, completi, il più possibile disaggregati, aggiornati e con lo storico dei dati nel tempo.
Se verrà attivato qualche servizio ufficiale di stato che farà quanto descritto, è molto molto probabile che questo servizio verrà spento.
Qui le note su COME CONTRIBUIRE al progetto. Grazie a Nicola Procopio per la redazione di queste note.
Dai dati pubblicati ogni giorno, viene prodotto un archivio, con i dati dei vari giorni. Il primo giorno di cui abbiamo raccolto i dati è 2 marzo 2020.
Il file è questo e la struttura è quella di sotto:
provincia | numero | regione | datetime |
---|---|---|---|
Bergamo | 372 | LOMBARDIA | 2020-03-03 |
Lodi | 482 | LOMBARDIA | 2020-03-03 |
Cremona | 287 | LOMBARDIA | 2020-03-03 |
in fase di verifica e aggiornamento | 36 | LOMBARDIA | 2020-03-03 |
--- | --- | --- | --- |
Ne viene prodotta pura una copia con il codice ISTAT provinciale.
Nota bene: si tratta del campo Codice dell'Unità territoriale sovracomunale (valida a fini statistici)
presente nella risorsa ISTAT "Elenco dei codici e delle denominazioni delle unità territoriali".
provincia | numero | regione | datetime | codiceISTAT |
---|---|---|---|---|
Abruzzo da verificare | 1 | ABRUZZO | 2020-03-03 | |
L'aquila | 1 | ABRUZZO | 2020-03-03 | 066 |
Pescara | 1 | ABRUZZO | 2020-03-03 | 068 |
Teramo | 3 | ABRUZZO | 2020-03-03 | 067 |
--- | --- | --- | --- | --- |
Dai dati pubblicati ogni giorno, viene prodotto un archivio con i dati dei vari giorni. Il primo giorno di cui abbiamo raccolto i dati è 2 marzo 2020.
Il file è questo e la struttura è quella di sotto:
Regione | Ricoverati con sintomi | Terapia intensiva | Isolamento domiciliare | Totale attualmente positivi | DIMESSI GUARITI | DECEDUTI | CASI TOTALI | TAMPONI | datetime |
---|---|---|---|---|---|---|---|---|---|
Lombardia | 698 | 167 | 461 | 1326 | 139 | 55 | 1520 | 9577 | 2020-03-03 |
Emilia Romagna | 187 | 24 | 187 | 398 | 4 | 18 | 420 | 2012 | 2020-03-03 |
Veneto | 49 | 19 | 229 | 297 | 7 | 3 | 307 | 10176 | 2020-03-03 |
Piemonte | 13 | 3 | 40 | 56 | 56 | 458 | 2020-03-03 | ||
--- | --- | --- | --- | --- | --- | --- | --- | --- | --- |
I dati sono accessibili anche in formato Json attraverso API:
NOTA: dopo l'annuncio da parte della protezione civile, le API sono state agganciate ai dati del repository ufficiale
Esempio:
Gli ultimi dati disponibili per ogni singola regione https://openpuglia.org/api/?q=getdatapccovid-19
Gli ultimi dati disponibili per la singola regione dove reg = nome regione
https://openpuglia.org/api/?q=getdatapccovid-19®=lombardia
Serie storica dei dati disponibili per regione dove reg = nome regione
e mode = ts
https://openpuglia.org/api/?q=getdatapccovid-19®=lombardia&mode=ts
Tutti i dati disponibili https://openpuglia.org/api/?q=getdatapccovid-19&mode=ts
Per completezza si documentano anche le veccie API che utilizzano i dati raccolti da onData
es. https://openpuglia.org/api/?q=getdatacovid-19®=lombardia
dove reg = nome regione
consente di ottenere l'ultimo dato disponibile per ogni provincia di quella particolare regione. Omettendo il nome della regione verranno restituiti i dati relativi a tutte le province per cui esiste il dato
https://openpuglia.org/api/?q=getdatacovid-19
La serie storica dei dati disponibili può essere richiesta introducendo mode=ts
nella query string.
es. https://openpuglia.org/api/?q=getdatacovid-19®=lombardia&mode=ts
Omettendo la regione vengono restituiti tutti i dati disponibili
https://openpuglia.org/api/?q=getdatacovid-19&mode=ts
es. https://openpuglia.org/api/?q=getsummarycovid-19®=lombardia
dove reg = nome regione
consente di ottenere il riepilogo dei dati disponibili per quella regione. Omettendo il nome della regione verranno restituiti i dati relativi a tutte le regioni per cui esiste il dato
https://openpuglia.org/api/?q=getsummarycovid-19
La serie storica dei dati disponibili può essere richiesta introducendo mode=ts
nella query string. I dati sono cumulativi, ossia si riferiscono ai totali complessivi riferiti alla data indicata
es. https://openpuglia.org/api/?q=getsummarycovid-19®=lombardia&mode=ts
Omettendo la regione vengono restituiti tutti i dati disponibili
https://openpuglia.org/api/?q=getsummarycovid-19&mode=ts
È un lavoro a cura di Vincenzo Patruno. Un grazie a #openpuglia per l'hosting.
I PDF pubblicati verranno archiviati in questa cartella.
A partire dal 4 marzo 2020, ogni giorno verrà creata una copia delle pagine sottostanti e degli URL che ciascuna contiene (quindi anche dei PDF citati sopra):
Ringraziamo Matteo Brunati per lo spunto.
Ringraziamo Luca Salvioli Mariani (Il Sole 24 Ore) per lo storico precedente al 2 marzo.