Closed leotuni closed 4 years ago
Ciao Leotuni, condivido il tuo ragionamento e suggerisco: siamo sicuri che i nuovi positivi debbano essere dichiarati solo attraverso la positività ad un tampone ?
Ad esempio con le TC polmonari si arriva a risultati in tempi più brevi.
Qui si parla di TC polmonari e ML/AI: https://www.policlinicocampusbiomedico.it/news/polmonite-da-coronavirus-ricerca-con-tc-polmonare
Grazie, ciao.
CIao Paolo, Se guardi nella colonna nuovi_tamponi_oggi, puoi notare che il numero di tamponi è particolarmente basso, 0, o negativo quando i tamponi sono inferiori ai positivi. Quindi penso sia più probabile che i dati dei tamponi non siano aggiornati correttamente no? Di sicuro quando sono negativi come in questo caso:
Index | data | denominazione_regione | totale_positivi | tamponi | nuovi_positivi_oggi | nuovi_tamponi_oggi | nuovi_positivi_oggi<= nuovi_tamponi_oggi |
---|---|---|---|---|---|---|---|
30 | 2020-02-25T18:00:00 | Lombardia | 231 | 3700 | 65 | 2237 | True |
51 | 2020-02-26T18:00:00 | Lombardia | 249 | 3208 | 18 | -492 | False |
Ciao Leotuni,
la mia riflessione non era certamente risolutiva del problema, anzi complementare, forse. Resto del tuo stesso avviso e condivido come dall'inizio i tuoi dubbi in merito.
Qui si possono confrontare le diverse qualità di dati che le regioni caricano sui loro siti: https://www.infodata.ilsole24ore.com/2020/03/29/dati-coronavirus-regione-va-conto-suo-aiutateci-mappare-condivide-cosa-aggiornato/?utm_term=Autofeed&utm_medium=LISole24Ore&utm_source=LinkedIn#Echobox=1585517024
Grazie, ciao.
Grazie per il link, certo che le regioni non caricano un file in csv è pazzesco. Non so se tu stai lavorando su questo repo, ma se è un problema con i dati delle regioni, e non di averli copiati male, è abbasta difficile corregerli
ciao, leo
Credo siano nel caos più totale e chi pubblica non ha responsabilità è chi ha organizzato e conduce la raccolta che è un incapace. Tale al presidente dell'INPS
Concordo nel dire che probabilmente ( quasi certamente sono nel caos più totale) e probabilmente ci sono parecchi errori.
L'errore in Emilia Romagna che il totale dei campioni il 30/03 non può essere minore del totale del 29/03 e guarda a caso quel -2001 è proprio l'ammanco per arrivare a numero del giorno prima.
2020-03-29T17:00:00 | Emilia-Romagna | 10535 | 52991 | 571 | 0 | False 2020-03-30T17:00:00 | Emilia-Romagna | 10766 | 50990 | 231 | -2001 | False
Insomma, problemi ne abbiamo. Ce ne faremo una ragione.
@ambr89 la colonna "nuovi_tamponi_oggi"= -2001 l'ho creata io facendo 50990-52991 =-2001, per illustrare il problema. Non è nel dataset originale.
Tra l'altro il numero di tamponi dovrebbe essere il numero di tamponi totali e non il numero di persone che hanno fatto il tampone. Quando ad esempio una persona viene dichiarata guarita é perché ha fatto 2 tamponi con esito negativo. Tale persona poi ha fatto anche il tampone nel passato con il quale é stata dichiarata positiva.
@gpinnaan corretto!
Ciao, si conferma che il numero dei tamponi è il totale dei tamponi effettuati, possono esserci degli errori di comunicazione dei dati pertanto potrebbero verificarsi dei ricalcoli. grazie a tutti per la collaborazione.
@MarcoGermani Molto bello. Se ho capito bene hai fatto un grafico incremento percentuale decessi dai punti totale decessi oggi/ totale decessi ieri. Il tuo grafico con il fit lineare che va sotto 1 non ha senso visto che totatale decessi oggi >= totale decessi ieri,
ciao, leo
@umbros Ok, era giusto per informarvi, grazie per il repo Buon lavoro, leo
@leotuni Ti ringrazio del complimento, ma non capisco il tuo commento. Speravo fosse chiaro che la mia è un'interpolante della serie storica dei tassi percentuali di variazione giornaliera dei decessi, basata sui dati pubblicati e calcolata con il metodo dei minimi quadrati. Se non è chiaro puoi consultare: R.J. Wonnacott. TH.H.Wonnacot - Trattato di econometrica - Isedi)
e Scusa ma non capisco la retta di regressione è una media condizionata
@MarcoGermani Premesso che posso aver malinteso i grafici. Hai fatto quattro fit lineari:
Moltiplicando il valore di oggi di incremento% ricoverati * totale ricoverati oggi = totale ricoverati domani
Un incremento % inferiore a 1 significa che il numero totale sta diminuendo. Mentre per attualmente positivi, ricoverati, e terapia intensiva, questo ha senso, visto che il totale di ricoverati può diminuire fino a 0 ricoverati. Per Decessi no, visto che i decessi totali non possono diminuire.
Infatti il fit lineare suggerisce che il 6/4 non ci saranno altri morti, e dopo il 6/4 il numero totale di morti diminiusce.
Forse il modello migliore per fittare il grafico incremento% Decessi non è lineare.
leo
@leotuni io non sono un esperto come te ma continuo a non capirti. Non ha alcun senso moltiplicare l'incremento % ricoverati di oggi per il totale dei ricoverati di oggi perché non darà alcun valore logico. Se vuoi stimare il numero dei ricoverati di domani devi utilizzare l'equazione che ha generato la retta di regressione. Il resto continuo a non capirlo perché parliamo del DELTA dei decessi che si spera vada a ZERO quanto prima ... forse non sono alla tua altezza o non riusciamo a capirci.
@MarcoGermani Cerco di spiegarmi meglio, che di esperto ho poco..
Faccio un esempio con i tuoi dati: Per i ricoverati Data | Tot Ricove | inncr. % Ricov |
---|---|---|
08/03/20 | 3.557 | 1,34 |
09/03/20 | 4.316 | 1,21 |
10/03/20 | 5.038 | 1,17 |
Quindi : inncr. % Ricov * Tot Ricove (ieri) = Tot Ricove (oggi) Nel tuo grafico inncr. % Ricov vs Data, il fit lineare va sotto il valore 1 Se: inncr. % Ricov<1 allora Tot Ricove (oggi) < Tot Ricove (ieri) E per i ricoverati ha senso, visto che le persone recuperano, il numero totale può scendere
Per i morti: Data | Totale deceduti | Incr % Deces |
---|---|---|
08/03/20 | 463 | 1,27 |
09/03/20 | 631 | 1,36 |
10/03/20 | 827 | 1,31 |
Quindi : Incr % Decessi * Totale deceduti(ieri) = Totale deceduti (oggi) Nel tuo grafico Incr % Decessi vs Data tra un paio di giorni il fit lineare di Incr % Decessi scende sotto l'uno. Se: inncr. Incr % Decessi<1 allora Totale deceduti (oggi) < Totale deceduti(ieri)
per esempio, Oggi i Decessi totali sono 13.915 se prendiamo come valore stimato dal frafico quello del 25/5= 0.5
leo
@leotuni La sua osservazione è corretta ma la retta in oggetto è una retta di regressione che, come mi insegna, il cui coefficiente angolare (lo speriamo tutti), continuerà ad andare verso il valore ZERO, e la retta diventerà un asintoto orizzontale (non lo sarà mai perfettamente ) con ordinata 1. Non riuscivo a capire la sua obiezione perché era per me evidente che l'intersezione della retta con le ascisse non aveva alcun significato. Ho modificato comunque l'intervallo delle ordinate. Saluti
Tipo di issue:
Riassunto
Ci sono tanti casi dove:
Nella tabella sotto metto la lista completa dei casi. La tabella comprende 4 colonne riprese dal file: la data, denominazione_regione , totale_positivi, tamponi 3 nuove colonne:
Ho aggiunto anche la row del giorno precedente per poter confermare i numeri. Le row dove nuovi_positivi_oggi<= nuovi_tamponi_oggi = False sono quelle con i dati sbagliati.
Attesa:
Attuale: