Open Pasquic opened 2 years ago
Ciao, hai ragione, per ora ho scritto il codice soprattutto per me senza troppa attenzione a che sia chiaro e comprensibile da parte di altri.
iterazioni
simulazioni faccio variare un poco la percentuale.Dati di input:
scenario
.xlsx" (dove scenario
è una stringa che indica uno dei possibili scenari da simulare, nel mio caso ho usato "01", "02", "03" e così via, l'importante è indicarlo all'inizio del file "elezioni.Rmd") - in questo file sono indicate le liste che si ipotizza parteciperanno alle elezioni, le percentuali nazionali che ci si aspetta conquisteranno, le coalizioni che si ipotizza formeranno, e così via. Nel mio caso ho preso le percentuali da uno degli ultimi sondaggi politici. Una delle prossime cose che devo fare è esplicitare la struttura di questo file.iterazioni
) di simulazioni, in ciascuna di esse lascio che le percentuali calcolate al punto 16 varino leggermente (in particolare, faccio il logaritmo delle percentuali, lo faccio variare secondo una distribuzione normale con deviazione standard specificata nella variabile variab
, dopodiché riporto questi valori a percentuali tramite la funzione softmax).Puoi trovare una descrizione del procedimento anche nel file "elezioni.Rmd" a partire dalla riga 858, oppure nell'output che viene generato.
Se ci sono punti ancora poco chiari dimmi pure.
In ogni casi, un suggerimento potrebbe essere quello di confrontare i dati reali delle elezioni 2018/2019 e regionali con i sondaggi di allora, e farne una proporzione in termini di voti partendo dagli attuali sondaggi.
Potrebbe essere un'idea interessante. Non so se avrò il tempo di implementarla entro le prossime elezioni, ma se qualcun altro vuole lavorarci sopra, volentieri.
Arrivo un po' in ritardo ma vorrei suggerire che aggiustare i sondaggi con l'errore storico dei sondaggi è teoreticamente sbagliato e non dovrebbe migliorare l'accuratezza della previsione. (https://gelliottmorris.substack.com/p/the-polling-website-where-republicans)
Ti ringrazio per il contributo! Leggendo l'articolo però direi che aggiustare i sondaggi con l'errore storico dei sondaggi non è teoricamente sbagliato in assoluto, semplicemente non ha senso farlo nel modo e nel contesto in cui lo ha fatto RCP. Può avere senso se, ad esempio, gli elettori di destra rispondono meno volentieri ai sondaggi degli elettori di sinistra. In quel caso i sondaggi saranno sempre un po' sbilanciati verso sinistra rispetto al risultato delle elezioni, e può avere senso stimare l'errore sistematico attraverso la media di un adeguato numero di differenze tra risultato delle elezioni e sondaggi. Nell'articolo l'autore evidenzia che non è il caso delle elezioni americane, e per questo motivo critica il fatto che RCP abbia comunque scelto di correggere i sondaggi (tra l'altro considerando un ridottissimo numero di precedenti elezioni).
Ad ogni modo, non l'ho fatto nell'elaborazione dello scorso anno, e dubito che avrò mai il tempo e la voglia per provare a implementarlo in futuro. Se qualcuno volesse cimentarsi, lascio a lui il compito di decidere quale procedimento sia formalmente corretto.
Ciao, intanto complimenti per il lavoro che hai svolto! Volevo chiederti alcune delucidazioni, se possibile: non riesco a capire quali sono i dati di input, se sono stimati a macro aree o a partire dai singoli collegi uninominali, poiché spulciando tra i file onestamente non son riuscito a trovare una risposta. In ogni casi, un suggerimento potrebbe essere quello di confrontare i dati reali delle elezioni 2018/2019 e regionali con i sondaggi di allora, e farne una proporzione in termini di voti partendo dagli attuali sondaggi.