italia / covid19-opendata-vaccini

Open Data su consegna e somministrazione dei vaccini anti COVID-19 in Italia - Commissario straordinario per l'emergenza Covid-19
Other
525 stars 199 forks source link

Totale Immunizzati (e monodosi) #157

Open CloudItaly opened 3 years ago

CloudItaly commented 3 years ago

Con l'entrata in opera del vaccino monodose, si chiede di inserire nei dataset, due nuove colonne:

Oggi si spaccia per totale "vaccinati/immunizzati", il valore contenuto nella colonna seconda dose. Basterebbe invece utilizzare il dato della colonna "immunizzati".

FrancescoDiMaggio commented 3 years ago

Concordo. C'è modo di sollevare meglio la questione, aggiungendo priorità o si aspetta una valutazione/risposta del team di @datateam-opendata?

camicius commented 3 years ago

l'importante è avere una risposta e che sia definitiva, il più possibile alla svelta, in modo da essere certi su come analizzare i dati (se imposto tutto perché le vaccinazioni Janssen siano prima_dose e poi vengono spostate devo risistemare, e gradirei evitare). @datateam-opendata dovrebbe dare una risposta ufficiale al più presto.

Personalmente un modo o l'altro non cambia gran ché, l'importante è che sia uno e che sia per sempre.

fede4096 commented 3 years ago

al momento mi risultano 556 dosi di Janssen somministrate in Puglia. Sono state inserite nel campo "prima_dose"

sapienzafra commented 3 years ago

Forse è presto per porre il problema, ma dato che sembra che il vaccino abbia una durata di 11-12 mesi, come verranno conteggiati gli immunizzati tra un anno? Chi ha il vaccino scaduto non sarà più immunizzato a meno che non abbia fatto una terza dose? Quindi il conteggio sarebbe: terza dose + seconda per i monodose - scaduti? E tra 2 anni? Mi chiedo se abbia senso parlare di "numero di immunizzati" sul lungo periodo.

CloudItaly commented 3 years ago

Forse è presto per porre il problema, ma dato che sembra che il vaccino abbia una durata di 11-12 mesi, come verranno conteggiati gli immunizzati tra un anno? Chi ha il vaccino scaduto non sarà più immunizzato a meno che non abbia fatto una terza dose? Quindi il conteggio sarebbe: terza dose + seconda per i monodose - scaduti? E tra 2 anni? Mi chiedo se abbia senso parlare di "numero di immunizzati" sul lungo periodo.

Per il momento è irrilevante perché basterebbe inventarsi il "Immunizzati con richiamo", importante è oggi risolvere sto problema dei vaccini monodose per evitare proprio errori di calcoli.

jrkager commented 3 years ago

Vorrei aggiungere che con l'attuale metodo di inserimento dei vaccini monodosi i file somministrazioni-vaccini-summary-latest sono diventati molto meno utili, in quanto la colonna prima_dose è corrotta. Da adesso in poi occorre lavorare con i non-summary file che sono considerabilmente più grandi e complicati da trattare.

Comunque temo che la decisione sia finale, vedendo che il codice della UI è già stato attualizzato, filtrando per fornitore "Janssen": https://github.com/italia/report-vaccini-anti-covid-19/commit/73b97f53ee4f07ba7acd6076903570c0d8ba822f.

Ago1896 commented 3 years ago

Vista l'infelice idea di contare i vaccini Johnson & Johnson nella colonna prima dose, vi volevo chiedere se esiste un modo su Google sheets di ricavare quante dosi sono state fatte di questo vaccino giorno per giorno.

capmar00 commented 3 years ago

Vista l'infelice idea di contare i vaccini Johnson & Johnson nella colonna prima dose, vi volevo chiedere se esiste un modo su Google sheets di ricavare quante dosi sono state fatte di questo vaccino giorno per giorno.

Ciao, non uso i google sheets ma nel file https://raw.githubusercontent.com/italia/covid19-opendata-vaccini/master/dati/somministrazioni-vaccini-latest.csv sono specificate le dosi per produttore per cui puoi estrapolarle e anche accreditarle sotto seconda dose invece che sotto la prima. Immagino che giocare con queste funzioni sia sufficiente: https://support.google.com/docs/answer/3093364?hl=en https://support.google.com/docs/answer/3093669 https://support.google.com/docs/answer/3093977?hl=en

Però mi sembra che i Google Sheets abbiano un limite massimo di righe e forse questo csv le ha già superate.

Ago1896 commented 3 years ago

Vista l'infelice idea di contare i vaccini Johnson & Johnson nella colonna prima dose, vi volevo chiedere se esiste un modo su Google sheets di ricavare quante dosi sono state fatte di questo vaccino giorno per giorno.

Ciao, non uso i google sheets ma nel file https://raw.githubusercontent.com/italia/covid19-opendata-vaccini/master/dati/somministrazioni-vaccini-latest.csv sono specificate le dosi per produttore per cui puoi estrapolarle e anche accreditarle sotto seconda dose invece che sotto la prima. Immagino che giocare con queste funzioni sia sufficiente: https://support.google.com/docs/answer/3093364?hl=en https://support.google.com/docs/answer/3093669 https://support.google.com/docs/answer/3093977?hl=en

Però mi sembra che i Google Sheets abbiano un limite massimo di righe e forse questo csv le ha già superate.

Il problema è proprio importare i dati in Fogli, poi il resto è facile

capmar00 commented 3 years ago

Vista l'infelice idea di contare i vaccini Johnson & Johnson nella colonna prima dose, vi volevo chiedere se esiste un modo su Google sheets di ricavare quante dosi sono state fatte di questo vaccino giorno per giorno.

Ciao, non uso i google sheets ma nel file https://raw.githubusercontent.com/italia/covid19-opendata-vaccini/master/dati/somministrazioni-vaccini-latest.csv sono specificate le dosi per produttore per cui puoi estrapolarle e anche accreditarle sotto seconda dose invece che sotto la prima. Immagino che giocare con queste funzioni sia sufficiente: https://support.google.com/docs/answer/3093364?hl=en https://support.google.com/docs/answer/3093669 https://support.google.com/docs/answer/3093977?hl=en Però mi sembra che i Google Sheets abbiano un limite massimo di righe e forse questo csv le ha già superate.

Il problema è proprio importare i dati in Fogli, poi il resto è facile

In effetti pare che il limite max di nuove righe per volta sia 40mila per cui non puoi importare in blocco il csv. Ho visto che c'è la funzione QUERY con cui puoi provare a selezionare per data e vedere se così riesci a importare solo le righe del giorno: https://support.google.com/docs/answer/3093343?hl=en quest'esempio è con IMPORTRANGE ma immagino funzioni anche con IMPORTDATA: https://blog.sheetgo.com/google-sheets-formulas/combine-query-with-importrange-in-google-sheets/

marcosolina commented 3 years ago

Mi sa che ti conviene usare Excel, i suoi limiti sono più alti rispetto a G Sheets https://support.microsoft.com/en-us/office/excel-specifications-and-limits-1672b34d-7043-467e-8e27-269d656771c3

Purtroppo il numero di righe può solo che crescere, quindi prima o poi si raggiungerà anche il limite di Excel. La soluzione migliore sarebbe di caricare i dati in un Database e poi fare le query a piacere. Io li ho caricati in un DB PostgreSQL, se ti può interessare ti posso spiegare come fare, qui un esempio del risultato

image

Ago1896 commented 3 years ago

Vista l'infelice idea di contare i vaccini Johnson & Johnson nella colonna prima dose, vi volevo chiedere se esiste un modo su Google sheets di ricavare quante dosi sono state fatte di questo vaccino giorno per giorno.

Ciao, non uso i google sheets ma nel file https://raw.githubusercontent.com/italia/covid19-opendata-vaccini/master/dati/somministrazioni-vaccini-latest.csv sono specificate le dosi per produttore per cui puoi estrapolarle e anche accreditarle sotto seconda dose invece che sotto la prima. Immagino che giocare con queste funzioni sia sufficiente: https://support.google.com/docs/answer/3093364?hl=en https://support.google.com/docs/answer/3093669 https://support.google.com/docs/answer/3093977?hl=en Però mi sembra che i Google Sheets abbiano un limite massimo di righe e forse questo csv le ha già superate.

Il problema è proprio importare i dati in Fogli, poi il resto è facile

In effetti pare che il limite max di nuove righe per volta sia 40mila per cui non puoi importare in blocco il csv. Ho visto che c'è la funzione QUERY con cui puoi provare a selezionare per data e vedere se così riesci a importare solo le righe del giorno: https://support.google.com/docs/answer/3093343?hl=en quest'esempio è con IMPORTRANGE ma immagino funzioni anche con IMPORTDATA: https://blog.sheetgo.com/google-sheets-formulas/combine-query-with-importrange-in-google-sheets/

Credo che la query entri in gioco dopo aver importato i dati (avevo già provato), infatti mi dà lo stesso errore. grazie comunque

Ago1896 commented 3 years ago

Mi sa che ti conviene usare Excel, i suoi limiti sono più alti rispetto a G Sheets https://support.microsoft.com/en-us/office/excel-specifications-and-limits-1672b34d-7043-467e-8e27-269d656771c3

Purtroppo il numero di righe può solo che crescere, quindi prima o poi si raggiungerà anche il limite di Excel. La soluzione migliore sarebbe di caricare i dati in un Database e poi fare le query a piacere. Io li ho caricati in un DB PostgreSQL, se ti può interessare ti posso spiegare come fare, qui un esempio del risultato

image

Credo che excel sia l'unica al momento. Provo anche con il tuo programma. Imparare qualcosa di nuovo fa sempre bene!

marcosqlbi commented 3 years ago

Se usate Power BI, il modello che abbiamo pubblicato su https://github.com/marcosqlbi/vaccination-italy/ include un calcolo che considera il numero di dosi necessarie per tipo di vaccino. Tuttavia, credo che ci sia un problema di cui nessuno sta tenendo conto. Chi si è ammalato di Covid riceve una sola dose di vaccino anche se il fornitore è a doppia dose. Queste persone risultano con una vaccinazione completa (credo ci sia un'esenzione sulla seconda dose) e quindi attualmente nel nostro calcolo risultano "in attesa di seconda dose", mentre in realtà non dovrebbero riceverla. Siccome parliamo di più di 4 milioni di casi a oggi, non è un dettaglio. Apro un thread a parte su questo aspetto perché forse in questo thread potrebbe rimanere un po' annegato.