pcm-dpc / COVID-19

COVID-19 Italia - Monitoraggio situazione
Other
3.86k stars 2.24k forks source link

Errore calcolo nuovi casi positivi #338

Closed natasso closed 4 years ago

natasso commented 4 years ago

Tipo di issue:

Riassunto

Il calcolo dei nuovi casi positivi dovrebbe essere la differenza dei casi totali di oggi (compresi i decessi e dimessi) meno quelli di ieri. Se invece viene calcolato tra i casi attuali di oggi ed i casi attuali di ieri, si ha una sottostima.

es: ieri c'erano 10 casi in attuali , oggi ci sono 5 nuovi casi, ma nel frattempo vengono dimesse due persone. Secondo il calcolo attuale, il numero dei nuovi casi sarebbe 13 (10 casi attuali di ieri + 3 casi attuali di oggi), mentre invece sono 15

Il problema è stato ripreso anche da https://www.worldometers.info/ image

Attesa:

Inserire una nuova colonna con i nuovi casi, oppure sostituire quella presente con il calcolo corretto

AndrewDevIT commented 4 years ago

La colonna a cui credo ti riferisci riporta la differenza dei positivi ieri e quelli di oggi ovvero i nuovi positivi ed è quindi giusta non si riferisce ai nuovi casi

floatingpurr commented 4 years ago

I nuovi casi sono il totale casi di oggi meno quelli di ieri. Su questo bot di Telegram puoi la differenza tra i due dati: https://t.me/covid19_dati_italia_bot

natasso commented 4 years ago

si è giusta, è frutto della differenza dei positivi di oggi meno quelli di ieri, ma trae in inganno perchè si chiama "nuovi positivi" e viene ripresa da molti media come il numero dei nuovi contagi. Mentre invece il numero di nuovi contagi è appunto la differenza tra il totale di oggi e quello di ieri. In termini di controllo dell'evoluzione dell'epidemia è necessario controllare questa seconda cifra.

Se si potesse aggiungere una colonna con questo valore, o specificare meglio che la colonna "nuovi positivi" non riguarda la crescita del contagio, sarebbe d'aiuto

ghost commented 4 years ago

È stato già fatto notare più e più volte. Non glie ne frega un cazzo a quanto pare. A questo punto è chiaro che lo facciano apposta.

FedericoStra commented 4 years ago

I'm late to the party, but...

È già stato fatto notare almeno in queste occasioni: #263, #268, #275, #277, #292, #294, #308, #314, #315, #332.

La mia pazienza nel ripetere e ripetere e ripetere e ripetere e ripetere e ripetere sta lentamente convergendo a 0.

Ho contattato alcuni giorni fa l'Ufficio Stampa della Protezione Civile, che è il vero responsabile di questo equivoco, ma non ho ricevuto risposta. Ho allora provveduto a contattare i principali giornali nazionali (La Stampa, Repubblica, Il Messaggero, Il Corriere sella Sera, Il Sole 24 Ore...) per avvisarli dell'equivoco. Dai più non ho ricevuto risposta. Vi segnalo però due tentativi andati a buon fine:

Vi segnalo anche questa ottima pagina del Sole 24 Ore: Coronavirus in Italia, i dati e la mappa: a inizio pagina sono chiaramente mostrati a sinistra la variazione degli attualmente positivi (+3780) e a destra i nuovi contagi del giorno (4789).

Concludo esprimendo la mia opinione, analoga a quella di @davidfregoli, che la conclusione che se ne trae è che la Protezione Civile non vuole che circoli questo dato, perché più elevato.

FedericoStra commented 4 years ago

A questo punto è chiaro che lo facciano apposta.

Oserei dire che a me era chiaro fin dal primo momento. La decisione surreale di non riportare nel bollettino ufficiale il numero di nuovi contagi registrati nel giorno (che è la misura più diretta della velocità di diffusione) può derivare solo da una grave incompetenza o una determinazione a tenere mascherato questo dato.

Uno potrebbe argomentare che, finché questo rimane soltanto un problema di comunicazione con i media e con le masse, si tratta di una faccenda secondaria.

La cosa che trovo veramente grave è che, pure a seguito di diverse dimostrazioni che svariati utenti del repository continuano a fraintendere il significato di alcune variabili (a cui contribuisce la documentazione sbagliata), non venga posto rimedio, neanche per il bene delle analisi basate su questi dati. Prova ne è per esempio il modo ridicolo in cui è stata liquidata la segnalazione #314. Questo a mio giudizio è inaccettabile.

danielesalpietro commented 4 years ago

Dai ci provo io, vediamo se lassù qualcuno ci ascolta e capisce qual è il problema ?

ho messo a confronto i dati usati dal www.worldometers.info (fields in english)con quelli pubblicati dai "ragazzi" del Dipartimento della Protezione Civile (campi in italiano in grassetto):

Total_Coronavirus_Cases = Total_Active_Cases + Total_Closed_Cases; Total_Active_Cases = Total_Infected_Patients_Cases; Total_Closed_Cases = Total_Cases_which_had_an_outcome;

Total_Infected_Patients_Cases = Infected_Patients_Cases_in_Mild_Condition + Infected_Patients_Cases_in_Serious_or_Critical ; Infected_Patients_Cases_in_Mild_Condition = isolamento_domiciliare ; Infected_Patients_Cases_in_Serious_or_Critical = totale_ospedalizzati = terapia_intensiva + ricoverati_con_sintomi; New_Infected_Patients_Cases = nuovi_attualmente_positivi = ????;

Total_Cases_which_had_an_outcome = Total_Patients_Cases_Recovered_or_Discharged + Total_Patients_Cases_Deaths; Total_Patients_Cases_Recovered_or_Discharged = dimessi_guariti; Total_Patients_Cases_Deaths = deceduti ; New_Patients_which_had_an_outcome = ???;

Ci sarò riuscito !?

FedericoStra commented 4 years ago

New_Infected_Patients_Cases = nuovi_attualmente_positivi = ????;

????

danielesalpietro commented 4 years ago

@FedericoStra è per dire che il numero, così come viene riportato oggi nei file non rappresenta quel valore che si vorrebbe vedere. Concordi ?

FedericoStra commented 4 years ago

Ah ok, quindi New_Infected_Patients_Cases ≠ nuovi_attualmente_positivi. Scusa forse non sono riuscito a capire bene il senso del tuo messaggio. Scritto così New_Infected_Patients_Cases = nuovi_attualmente_positivi = ???? mi sembrava non troppo chiaro il significato.

paolodecarolis commented 4 years ago

E' scandaloso, anche io l'ho segnalato, ma continuano - sopratutto in Lombardia - a fornire i dati in maniera errata senza dare effettiva evidenza ai nuovi positivi. Facendo la differenza fra casi totali del giorno e del giorno precedente ricomprendono i morti e i dimessi/guariti. Quindi crescendo i dimessi si vede crescere il dato giornaliero. Solo alcuni - come la protezione civile nella sua tabella - a livello nazionale evidenzia solamente i casi positivi del giorno. Che poi questi dati siano cmq un pò grossolani, vabbè ... lasciamo stare.

paolodecarolis commented 4 years ago

I'm late to the party, but...

È già stato fatto notare almeno in queste occasioni: #263, #268, #275, #277, #292, #294, #308, #314, #315, #332.

La mia pazienza nel ripetere e ripetere e ripetere e ripetere e ripetere e ripetere sta lentamente convergendo a 0.

Ho contattato alcuni giorni fa l'Ufficio Stampa della Protezione Civile, che è il vero responsabile di questo equivoco, ma non ho ricevuto risposta. Ho allora provveduto a contattare i principali giornali nazionali (La Stampa, Repubblica, Il Messaggero, Il Corriere sella Sera, Il Sole 24 Ore...) per avvisarli dell'equivoco. Dai più non ho ricevuto risposta. Vi segnalo però due tentativi andati a buon fine:

  • Il Post: Perché ogni giorno ci sono due numeri diversi sull’aumento dei contagi:

    Nel quotidiano riepilogo diffuso dalla Protezione Civile sui dati del contagio da coronavirus in Italia compaiono ogni giorno due numeri che sembrano definire la stessa cosa e che però sono diversi, confondendo un po’ le idee a molte persone. Per fare un esempio, domenica la Protezione Civile ha annunciato un aumento dei positivi al coronavirus di 3.957, pur essendo l’aumento complessivo dei contagiati uguale a 5.560.

  • Il Sole 24 Ore: Coronavirus, ultime notizie: in Italia 50.418 casi positivi e 6.077 vittime (+601), rallentano i contagi. Gallera: «In Lombardia luce in fondo al tunnel»:

    Come leggere i dati della Protezione civile Una premessa di metodo è indispensabile per la interpretazione dei dati perché la comunicazione ufficiale durante la conferenza stampa delle 18 tende a equivocare tra «attualmente positivi» e «nuovi positivi» nelle ultime 24 ore. La categoria attualmente positivi include le persone trovate positive al tampone e che in questo momento si trovano o in isolamento domiciliare o sono ricoverate con sintomi o ricoverate in terapia intensiva. Dalla categoria degli attualmente positivi si esce per due ragioni opposte: perché guariti o perché, purtroppo, deceduti. Il numero da considerare è dunque quello dei casi totali da inizio epidemia che sarà fondamentale seguire nell'evoluzione della crisi. Perché è la sua variazione a dirci quanti sono davvero giornalmente - tolti guariti e morti - i nuovi malati di Covid-19. Oggi sono 4.789.

    Sì lo so che questa spiegazione fa pena, ma che ci volete fare? Non gliel'ho scritta io. Sempre meglio di niente. Quanto meno magari spinge la gente a pensare.

Vi segnalo anche questa ottima pagina del Sole 24 Ore: Coronavirus in Italia, i dati e la mappa: a inizio pagina sono chiaramente mostrati a sinistra la variazione degli attualmente positivi (+3780) e a destra i nuovi contagi del giorno (4789).

Concludo esprimendo la mia opinione, analoga a quella di @davidfregoli, che la conclusione che se ne trae è che la Protezione Civile non vuole che circoli questo dato, perché più elevato.

.. a me sembra che la protezione civile con la loro tabella diffusa giornalmente siano gli unici a fornire un dato complessivo corretto ... gli altri, no

FedericoStra commented 4 years ago

Facendo la differenza fra casi totali del giorno e del giorno precedente ricomprendono i morti e i dimessi/guariti. Quindi crescendo i dimessi si vede crescere il dato giornaliero.

Mi sembra che stai sostenendo che nuovi_attualmente_positivi sia il numero di nuovi contagi giornalieri. In tal caso ti sbagli. Vai a leggerti le spiegazioni nei thread che ho linkato.

paolodecarolis commented 4 years ago

scusa, citi anche tu il riferimento del Sole 24 Ore. Secondo me entrambi i dati sono validi ma rappresentano il fenomeno in modo differente. ATTUALMENTE POSITIVI - VARIAZIONE GIORNALIERA (3780) CASI TOTALI DA INIZIO EPIDEMIA - VARIAZIONE GIORNALIERA: (4789)

Il primo dato evidenzia l'inerzia giornaliera del contagio, sarebbe inutile aggiungere morti e dimessi Il secondo dato rappresenta la magnitudo del problema complessivo e ricomprende la sommatoria dall'inizio dei positivi ripartiti in attualmente positivi, morti e dimessi.

Per me è più corretto per un bollettino corretto spiegare entrambi i numeri, col secondo si può essere fuorvianti perchè se hai 4000 ma 3000 sono i guariti e 1000 i morti, evidentemente il fenomeno sta terminando. Invece dire i casi di oggi sono 4.000 non rappresenta la dinamica epidemiologica.

FedericoStra commented 4 years ago

Il primo dato evidenzia l'inerzia giornaliera del contagio, sarebbe inutile aggiungere morti e dimessi

@paolodecarolis No, non ci siamo affatto. Non stiamo "aggiungendo morti e dimessi". È dall'altro numero che vengono implicitamente sottratti! Cerco di spiegarmi per l'ennesima volta, anche se tipicamente queste cose vengono insegnate durante le elementari. Ci sono due numeri:

Il numero che rappresenta la diffusione dell'epidemia è il primo numero: nuovi_casi. Pensare che il secondo numero sia più rilevante per stabilire se l'epidemia sta rallentando è una grandissima cavolata, alimentata dalla tremenda decisione dell'ufficio stampa della Protezione Civile di divulgare questo secondo numero lasciando intendere che sia la cosa giusta da guardare. Sbagliato.

doppioandante commented 4 years ago

Per me è più corretto per un bollettino corretto spiegare entrambi i numeri, col secondo si può essere fuorvianti perchè se hai 4000 ma 3000 sono i guariti e 1000 i morti, evidentemente il fenomeno sta terminando. Invece dire i casi di oggi sono 4.000 non rappresenta la dinamica epidemiologica.

Capisco cosa vuoi dire, ma penso che al contrario il dato rilevante sia proprio 4000, perché incrementa i nuovi infetti e l'andamento dell'epidemia è in prima battuta proporzionale al prodotto degli infetti e dei suscettibili di infezione; quest'ultimo è pressoché costante se si considera la popolazione totale, anche tolti i guariti e i deceduti.

Un altro motivo per ritenere poco intuitivo il secondo indice è che può diventare negativo se i malati rimangono costanti ma aumentano i decessi e i guariti. Di sicuro è più chiaro usare il totale dei casi per fare la differenza.

FedericoStra commented 4 years ago

Aggiungerei un'ultima osservazione.

I report della protezione civile e dei giornali lasciano intendere che avremo vinto quando il numero che loro riportano (nuovi_attualmente_positivi) scenderà a 0. Questo è sbagliato.

paolodecarolis commented 4 years ago

Punti di vista ... in ogni caso ogni giorno la Protezione Civile pubblica una chiara tabella diffusa praticamente solo dal Corriere o pochi altri. https://www.corriere.it/salute/malattie_infettive/20_marzo_24/coronavirus-italia-69176-casi-totali-6820-morti-bollettino-24-marzo-d3cc5416-6deb-11ea-9b88-27b94f5268fe_preview.shtml?reason=unauthenticated&cat=1&cid=rs8tBgJP&pids=FR&credits=1&origin=https%3A%2F%2Fwww.corriere.it%2Fsalute%2Fmalattie_infettive%2F20_marzo_24%2Fcoronavirus-italia-69176-casi-totali-6820-morti-bollettino-24-marzo-d3cc5416-6deb-11ea-9b88-27b94f5268fe.shtml

Sono specificati tutti i numeri in modo che si possa avere un quadro abbastanza completo; per chi è in grado di dargli una lettura.

Molti altri invece si limitano a annunci unidirezionali con mix di dati buttati lì che non danno l'idea reale; parlo in particolare di quando sono i politici a presentare il fenomeno.

I morti, per esempio, pur essendo un dato importante secondo me oggi non hanno grande rilevanza. E' implicito che se per 10 giorni i contagi sono aumentati, ora i morti salgano. Non c'è molto da meravigliarsi.

Poi dipende da cosa si vuole sapere:

Quindi penso che la tabella presentata dalla protezione civile sia il modo più corretto. La presentazione 'verbale' la lascerei alle parabole.

FedericoStra commented 4 years ago

@paolodecarolis Non sono abbonato al Corriere quindi non riesco ad aprire il link. Se però ti riferisci a questo pdf https://github.com/pcm-dpc/COVID-19/blob/master/schede-riepilogative/regioni/dpc-covid19-ita-scheda-regioni-20200324.pdf, allora non sono d'accordo che dia un quadro abbastanza completo.

MANCA IL NUMERO DI NUOVI CONTAGI GIORNALIERI!

Ma come si fa a fare un report su un'epidemia senza riportare i nuovi contagi?!?

gb88 commented 4 years ago

@federicostra

@paolodecarolis Non sono abbonato al Corriere quindi non riesco ad aprire il link. Se però ti riferisci a questo pdf https://github.com/pcm-dpc/COVID-19/blob/master/schede-riepilogative/regioni/dpc-covid19-ita-scheda-regioni-20200324.pdf, allora non sono d'accordo che dia un quadro abbastanza completo.

MANCA IL NUMERO DI NUOVI CONTAGI GIORNALIERI!

Ma come si fa a fare un report su un'epidemia senza riportare i nuovi contagi?!?

Hai perfettamente ragione...non possiamo fare una rappresentazione corretta comprensibile da rendere disponibile online, magari divisa per provincia? Sempre che non esista già e mi sia sfuggito

Pieffe68 commented 4 years ago

Aggiungerei un'ultima osservazione.

  • Quando nuovi_attualmente_positivi = 0, l'epidemia è in equilibrio, nel senso che ogni giorno le persone che si ammalano sono tante quante quelle che guariscono o muoiono. Il virus non è stato debellato.
  • Quando nuovi_casi = 0, non ci sono più contagi nuovi. Questo significa che l'epidemia è terminata. Il virus è stato debellato.

I report della protezione civile e dei giornali lasciano intendere che avremo vinto quando il numero che loro riportano (nuovi_attualmente_positivi) scenderà a 0. Questo è sbagliato.

Esattamente. Non capisco perchè non si voglia capire...

valemercurii commented 4 years ago

Concludo esprimendo la mia opinione, analoga a quella di @davidfregoli, che la conclusione che se ne trae è che la Protezione Civile non vuole che circoli questo dato, perché più elevato.

E poi..

  • Quando nuovi_casi = 0, non ci sono più contagi nuovi. Questo significa che l'epidemia è terminata. Il virus è stato debellato.

Queste frasi mi hanno fatto un po' rizzare i peli e quindi mi scuso se sarò logorroica e un po' troppo filosofica per Github. Dobbiamo tener conto che non esiste solo la matematica in questi casi. Ma anche la logica, la statistica ed il buon senso.

Quello che @FedericoStra continui a sostenere insieme a tanti altri è inattaccabile dal punto di vista puramente matematico sulla base di queste tabelle. Tuttavia starei attenta ad affermare che _il virus verrà debellato quando nuovi_casi = 0_. Forse idealmente è vero, ma è risaputo, come affermi tu stesso, che i casi reali asintomatici sono molti di più.

Ma questo non siamo né io né te a dirlo in primis, ma Borrelli stesso ha affermato che statisticamente gli asintomatici potrebbero essere anche un fattore 10 in più. Questo anche per sottolineare che è inutile fare tesi complottiste, della serie il DPC ci nasconde la verità, quando è il capo stesso ad affermare che il dato vero potrebbe essere molto più alto.

L'andamento di nuovi_attualmente_positivi e nuovi_casi è paragonabile e anche se la loro differenza è arrivata talvolta al migliaio di persone e oltre, è insignificante rispetto ai contagi reali 'nascosti' (decine di migliaia). Non a caso l'andamento epidemiologico andrebbe osservato su scala logaritmica, ad es. ecco un articolo interessante per il pubblico generico: https://www.nytimes.com/2020/03/20/health/coronavirus-data-logarithm-chart.html

Dietro a questi dati c'è un enorme lavoro del DPC che si scontra a) con una situazione difficile e b) la burocrazia. Ogni giorno tutte le regioni devono comunicare dei dati in tempo per il bollettino delle 18, l'ISS deve verificare i decessi e quant'altro. Per questo non mi trovo tanto distante come punto di vista da @pi-dot, pur consapevole che la colonna tamponi non è anch'essa tanto affidabile (ma non per colpa del DPC, ma per un concerto burocratico a contorno). I tamponi non è chiaro a chi li fanno e quando li fanno (si veda il caso della regione Lazio in #344 ), ma sfido io a coordinare questa cosa, quando hai focolai a destra e sinistra, ospedali in tilt e tante persone positive hanno bisogno di double-check.

Insomma non è facile, e visto che spesso io stessa, anche per lavoro, mi trovo a combattere con i complottisti della serie "la terra è piatta" e "non siamo mai andati sulla luna", non riesco a sopportare che tutta questa gente del DPC che si espone al virus ogni giorno per ottenere dati (mentre noi facciamo i nerd dietro un PC sul fatto che sia giusto Log 3000 o Log 4000 con un errore enorme associato) venga accusata di nascondere la verità.

Morale della favola: Va bene la matematica, ma attenti a ciò che si afferma e soprattutto, si divulga. Sarà troppo filosofico per voi, ma l'unica cosa che debellerà l'epidemia è un vaccino, non 'nuovi_casi = 0'.

ghost commented 4 years ago

Senti per me puoi filosofeggiare quanto vuoi, l'unica cosa che mi interessa è non trovare scritto "NUMERO DI CONTAGI IN CALO PER IL TERZO GIORNO CONSECUTIVO" quando apro repubblica.it

valemercurii commented 4 years ago

Senti per me puoi filosofeggiare quanto vuoi, l'unica cosa che mi interessa è non trovare scritto "NUMERO DI CONTAGI IN CALO PER IL TERZO GIORNO CONSECUTIVO" quando apro repubblica.it

Su questo sono d'accordo, infatti credo che tu non abbia 'ascoltato' niente di quello che ho scritto perché il mio discorso era incentrato su altri problemi che questa discussione sta generando.

danielesalpietro commented 4 years ago

Ragazzi l'unica cosa su cui non potevano mentire (fino a ieri) erano i "deceduti", già oggi mi aspetto un numero diverso, più "politicamente corretto".

Fare analisi partendo dai questi dati, è un puro esercizio accademico (tanto per passare il tempo) dopo le dichiarazioni di ieri del capo della Protezione Civile. Le fonti (autorevoli) che forniscono questi dati non sono attendibili, basta che una o due regioni non trasmettano correttamente i dati e tutte le statistiche "saltano"; mi vi rendete conto chi fornisce questi dati alla protezione civile ?

"La verità ci renderà liberi", ma oggi la libertà è minacciata (e non dal Covid-19).

giane88 commented 4 years ago

Direi che il corriere della sera come ha detto @paolodecarolis è l'unico che riporta le info complete. compresa la distinzione tra "nuovi contagiati" e "nuovi attualmente positivi" qui in link diretto all'infografica https://public.tableau.com/views/COVID-19Italia_15849737399690/Covid-19Italia?:embed=y&:embed_code_version=3&:loadOrderID=0&:display_count=y&:origin=viz_share_link

higaxman commented 4 years ago

Sorry, maybe consistent in itself, but is it relevant? I strongly disagree with your conclusion: using the current definition if everyone that get a positive test dies same day you have then “new infections” equal to zero... end of the epidemic ....everyone happy, right? This number is not conceptually consistent and the description is badly allusive. And publishing non-misleading statistics is a question of transparency, misleading the public with allusive words is not serious. 

FedericoStra commented 4 years ago

I don't fully understand the meaning of your first paragraph, but...

And publishing non-misleading statistics is a question of transparency, misleading the public with allusive words is not serious.

I strongly disagree with this statement. The last evidence is #365, where during a press conference the representative intentionally eluded a direct question of a journalist asking for clarification on the meaning of "new currently positive" vs. "new cases". Transparency is also a matter of how you communicate to the citizens, not just a bunch of users on GitHub.

FedericoStra commented 4 years ago

@valemercurii O santo cielo!...

Dobbiamo tener conto che non esiste solo la matematica in questi casi. Ma anche la logica, la statistica ed il buon senso.

Innanzi tutto, ti faccio notare che per lo meno logica e statistica rientrano a pieno titolo nella matematica. Inoltre, si potrebbe argomentare che anche il buon senso va molto di pari passo con la matematica, quindi non capisco cosa stai cercando di dire...

Passando invece alle cose serie,

Quello che @FedericoStra continui a sostenere insieme a tanti altri è inattaccabile dal punto di vista puramente matematico sulla base di queste tabelle. Tuttavia starei attenta ad affermare che il virus verrà debellato quando nuovi_casi = 0. Forse idealmente è vero, ma è risaputo, come affermi tu stesso, che i casi reali asintomatici sono molti di più.

È ovvio che ci sono almeno tre categorie di dati: il numero di contagi reale, il numero di contagi censiti dalla Protezione Civile, e molteplici possibili stime del numero effettivo di contagi basate sui modelli più arzigogolati che ci si può immaginare. Ovviamente, ovviamente, OVVIAMENTE, l'epidemia sarà terminata quando nuovi_casi_veri = 0 stabilmente nel tempo (non un singolo giorno per puro caso), e non invece quando nuovi_casi_censiti = 0. Questo mi pare così evidente che non ero stato troppo a puntualizzare.

Ciò non toglie che la quantità giusta da guardare sia "nuovi contagi", in tutte le sue forme e varianti, e non "variazione degli attualmente positivi".

Inoltre, proprio vista l'esigenza di fare modelli per stimare con accuratezza il numero reale di infetti, mi sembra ancora più importante risolvere questo problema della comunicazione dei dati, visto che causa che numerose persone fraintendano il significato di queste grandezze (tu stessa ne eri un esempio: #292, #294).

L'andamento di nuovi_attualmente_positivi e nuovi_casi è paragonabile e anche se la loro differenza è arrivata talvolta al migliaio di persone e oltre, è insignificante rispetto ai contagi reali 'nascosti' (decine di migliaia).

L'andamento comincerà a diventare significativamente diverso nel futuro prossimo (si spera) quando nuovi_attualmente_positivi diventerà negativo, mentre nuovi_casi resterà ancora positivo perché continueranno a esserci persone nuove che vengono contagiate.

Giuliano69 commented 4 years ago

Da alcuni giorni rifletto su questi dati; inizialmente critico … cerco di trovare una spiegazione ai dati così presentati: Penso si siano basati su uno storico modello matematico per rappresentare le epidemie: il modello SIR di Kermack e McKendrick: popolazione dei Sani, Infetti, Rimossi (guariti e defunti)

Il dato della Protezione Civile “nuovi_attualmente_positivi”, è la variazione (andamento) degli infetti nel modello SIR: ΔI(n)=I(n)-I(n-1).
Ha un suo sinficato nel modello matematico SIR. E’ forse discutibile la scelta di “positivi” usato come sinonimo di “infetti”...

E’ pacifico che i contagiati dal virus (persone sia ancora infette che rimosse) , sono chiaramente IR(n)=I(n)+R(n). E pacificamente la loro variazione ΔIR(n)= I(n)+R(n) – I(n-1) - R(n-1).

Effettivamente se i giornalisti non si informano sul significato di quello che stanno leggendo e lo riportano “a intuito” la colpa è ANCHE loro.. Sicuramente aiuterebbe se la tabella riportasse anche ΔIR(n), così da “aiutare” i giornalisti poco "intuitivi"...

MA … ΔI(n) sarà SEMPRE minore di ΔIR(n) ? No.

All’ INIZIO quando i rimossi aumentano giornalmente [R(n) > R(n-1)] si , ma dopo raggiunto il PICCO dei rimossi (quando cioè inizieranno a diminuire ogni giorno) darà un differenza maggiore, e nell’equivoco i numeri sembreranno andare peggio di quanto lo siano in realtà….

potrebbe essere un motivo per mettere mano adesso alla tabella…altrimenti in futuro i risultati raggiunti saranno ridotti da questa stessa tabella Un buono motivo ??

FedericoStra commented 4 years ago

Sì certamente questo è il modello standard di base per descrivere un'epidemia. Vedi anche Compartmental models in epidemiology per alcune varianti. Poi ovviamente si possono fare cose più complicate modellizzando il grafo dei contatti tra persone.

Effettivamente se i giornalisti non si informano sul significato di quello che stanno leggendo e lo riportano “a intuito” la colpa è ANCHE loro.. Sicuramente aiuterebbe se la tabella riportasse anche ΔIR(n), così da “aiutare” i giornalisti poco "intuitivi"...

Certo che è "anche" colpa loro, ma credo che davvero pochi giornalisti abbiano studiato matematica dopo le superiori, quindi c'è davvero la necessità di presentare i dati nella forma più chiara e completa possibile.

MA … ΔI(n) sarà SEMPRE minore di ΔIR(n) ? No.

All’ INIZIO quando i rimossi aumentano giornalmente [R(n) > R(n-1)] si , ma dopo raggiunto il PICCO dei rimossi (quando cioè inizieranno a diminuire ogni giorno) darà un differenza maggiore, e nell’equivoco i numeri sembreranno andare peggio di quanto lo siano in realtà….

Ti sbagli. R(n) è una quantità monotona debolmente crescente, quindi ΔR(n) >= 0, quindi ΔIR(n) <= ΔI(n). Non c'è nessun "picco dei rimossi".

FedericoStra commented 4 years ago

Scusate ma non facendo tamponi a tutti ogni giorno come può essere corretto il dato dei nuovi positivi?

Infatti questi sono i "nuovi positivi censiti". Poi uno si può spremere le meningi per dedurre una stima del numero reale di nuovi positivi. I nuovi ricoverati giornalieri non tengono traccia né di quelli che se ne stanno a casa né degli asintomatici.

zakkos commented 4 years ago

Sono contento di vedere che questa issue sia ancora aperta ma troppe che rilevavano lo stesso problema sono state chiuse o peggio eliminate senza troppi complimenti.

higaxman commented 4 years ago

I don't fully understand the meaning of your first paragraph, but...

And publishing non-misleading statistics is a question of transparency, misleading the public with allusive words is not serious.

I strongly disagree with this statement. The last evidence is #365, where during a press conference the representative intentionally eluded a direct question of a journalist asking for clarification on the meaning of "new currently positive" vs. "new cases". Transparency is also a matter of how you communicate to the citizens, not just a bunch of users on GitHub.

I believe we are saying the same thing. I believe there is a huge flaw about how data are represented. My first paragraph was just an extreme example of how misleading is to give the number "nuovi attualmente positivi" (further omitting the new_cases) as:

nuovi_attualmente_positivi = attualmente_positivi(oggi) - attualmente_positivi(ieri) = nuovi_casi - guariti(oggi) - deceduti(ieri)

I see media taking the "allusive" (nuovi_attualmente_positivi) as it truthfully report "new_cases" when, indeed, it does not mean the epidemic is slowing down.

FedericoStra commented 4 years ago

@higaxman Oh yes sure. Luckily, now the epidemic seems to be finally slowing down also according to the relevant metric.

I just wanted to point out to everybody the level of censorship that lead to the removal of the issue #365 that I raised. The issue was about the way one of the members of Protezione Civile eluded the question of a journalist who was asking for clarification about the two numbers during today's conference press.

The answer given was clearly something they had prepared for such an occasion, in order to avoid giving an explanation.

Now don't tell me they haven't reached the point of lying to the audience. There is no excuse for such a behavior.

You can see the footage here, starting at 19:00.

natasso commented 4 years ago

Credo che la conferenza di oggi abbia chiarito il motivo dietro la pubblicazione del valore _nuovi_attualmentepositivi: la protezione civile si occupa delle persone che necessitano assistenza pertanto, nonostante tutte le limitazioni dietro questi valori (e gli asintomatici?, e i tamponi?, e i malati rinchiusi in casa senza tampone? etc), quel numero rappresenta per loro la quantità di persone che necessitano potenzialmente aiuto.

La richiesta che tutti facciamo in coro però è: insieme a questo valore, sarebbe possibile aggiungere un'altra colonna con la differenza tra il totale dei casi di oggi ed il totale di ieri per aiutare la popolazione a capire meglio la differenza tra le persone che potenzialmente necessitano aiuto dalla protezione civile e l'andamento dell'epidemia?

ps: anche oggi i giornali hanno titolato quarto giorno di trend in calo, ma il titolo corretto sarebbe dovuto essere per il quarto giorno consecutivo, il trend di potenziali contagiati che richiedono aiuto alla protezione civile, è in calo :)

FedericoStra commented 4 years ago

Credo che la conferenza di oggi abbia chiarito [...]

L'avrà chiarito a te che sei al corrente di queste discussioni, ma non di certo al giornalista e al grande pubblico. Sono molto critico di come è stata data risposta alla domanda. O meglio, non è stata data.

luconedj commented 4 years ago

Credo che la conferenza di oggi abbia chiarito [...]

L'avrà chiarito a te che sei al corrente di queste discussioni, ma non di certo al giornalista e al grande pubblico. Sono molto critico di come è stata data risposta alla domanda. O meglio, non è stata data.

Senti ma una dashboard con I numeri "buoni" per regione dove potrei trovarla? Grazie

duckyb commented 4 years ago

@FedericoStra secondo me i giornalisti inizieranno a farsi due domande quando Borrelli inizierà a leggere cifre negative. Almeno spero

Senti ma una dashboard con I numeri "buoni" per regione dove potrei trovarla? Grazie

@luconedj Ecco, te ne ho creata una al volo https://observablehq.com/@duckyb/covid-19-regioni-ditalia

Qui puoi vedere l'andamento dei _nuoviinfetti

natasso commented 4 years ago

Senti ma una dashboard con I numeri "buoni" per regione dove potrei trovarla? Grazie

Https://aka.ms/coviditalia

luconedj commented 4 years ago

@FedericoStra secondo me i giornalisti inizieranno a farsi due domande quando Borrelli inizierà a leggere cifre negative. Almeno spero

Senti ma una dashboard con I numeri "buoni" per regione dove potrei trovarla? Grazie

@luconedj Ecco, te ne ho creata una al volo https://observablehq.com/@duckyb/covid-19-regioni-ditalia

Qui puoi vedere l'andamento dei _nuoviinfetti

Thanks ;)

luconedj commented 4 years ago

Senti ma una dashboard con I numeri "buoni" per regione dove potrei trovarla? Grazie

Https://aka.ms/coviditalia

Grazie mille !

adetogni commented 4 years ago

anche qui: https://app.powerbi.com/view?r=eyJrIjoiZTg0Zjk4NzAtZDA0Ny00Yjg5LThlOWYtNThiMWJjYWRhZGIwIiwidCI6IjczN2QyMGQ1LTU0MzMtNGNhNi05YjVkLTQ4ZmU0OTRkZWVmOCIsImMiOjh9&refresh=15

adetogni commented 4 years ago

@natasso bella la tua dashboard, complimenti

paolodecarolis commented 4 years ago

.. meno male che almeno Gallera fornisce i dati in modo chiaro ed esaustivo ...

adetogni commented 4 years ago

.. meno male che almeno Gallera fornisce i dati in modo chiaro ed esaustivo ... Gallera ha detto dei numeri che non mi tornavano.

fiorelisa commented 4 years ago

@FedericoStra secondo me i giornalisti inizieranno a farsi due domande quando Borrelli inizierà a leggere cifre negative. Almeno spero

Senti ma una dashboard con I numeri "buoni" per regione dove potrei trovarla? Grazie

@luconedj Ecco, te ne ho creata una al volo https://observablehq.com/@duckyb/covid-19-regioni-ditalia

Qui puoi vedere l'andamento dei _nuoviinfetti

Scusa, mi pare manchi il Veneto.... si può aggiungere? ^^

helloer00 commented 4 years ago

schema

helloer00 commented 4 years ago

2020-03-27 19 06 04

JanosAudron commented 4 years ago

@FedericoStra secondo me i giornalisti inizieranno a farsi due domande quando Borrelli inizierà a leggere cifre negative. Almeno spero

Senti ma una dashboard con I numeri "buoni" per regione dove potrei trovarla? Grazie

@luconedj Ecco, te ne ho creata una al volo https://observablehq.com/@duckyb/covid-19-regioni-ditalia Qui puoi vedere l'andamento dei _nuoviinfetti

Scusa, mi pare manchi il Veneto.... si può aggiungere? ^^

Ho trovato questa pagina che riporta i grafici molto ben fatti: https://lab24.ilsole24ore.com/coronavirus/