Open domenicodigangi opened 3 years ago
Nella call di 12/4/2020 abbiamo concordato di analizzare la coverage in simulazione sul toy model, aggiungendo anche la filtering uncertainty
Recap di quanto fatto discusso in #29
Steps necessari
La componente dovuta alla filtering uncertainty non sembra aggiungere molto alla parameter uncertainty. Filt + par :area rosa solo filtering : linee verdi
Le confidence bands sono molto conservative, con coverages piú alte del valore nominale. All aumentare di T le bande si allargano. Questo mi sembra controintuitivo e potrebbe indicare un errore.
Le confidence bands, e rispettive coverages, nelle figure al commento precedente sono errate. Praticamente, per eliminare piccoli autovalori negativi nello stimatore di white della matrice di covarianza delle MLE ( B^(-1) A B^(-1) ) sommavo un valore fisso (10^-3) all'autovalore negativo. Inoltre, @gbormetti ha sottolineato che l'argomento per giustificare le confidence bands relative alla parameter e filtering uncertainty potrebbe non essere valido per processi deterministici.
Ho ricontrollato il codice e proceduto come segue:
Possibili spiegazioni eventuale scarsa qualitá delle confidence bands:
Possibili soluzioni che sto esplorando per ottenere delle confidence bands che abbiano una coverage piú vicina al valore nominale:
Ho trovato un errore nella mia implementazione. Mi sono allineato a quanto suggerito dall'Hamilton (pg. 144 credo ) per l'inferenza di parametri che devono rispettare dei bounds (e.g. 0<B<0 nei modelli SD). In pratica, anche se suggerisce di ottimizzare in uno spazio unbounded (cosa che facevo giá, con link functions), consiglia di associare l'incertezza ai parametri restricted.
Se prendiamo a riferimento la distribuzione dei parametri statici da parametric bootstrap, sembra che lo stimatore di white non sia molto accurato . Nelle figure seguenti N=150, T=300
In particolare tende a sottostimare la diagonale della matrice di varianza covarianza
Esempi di confidence bands da stimatore di white e da parametric bootstrap. Il dgp é Score Driven
Non ho ancora calcolato le coverages perché servirebbe parecchio tempo e temo che continuerebbero a essere lontane dal valore nominale. Nelle prove fatte ho ottenuto risultati sempre simili.
Al momento come next steps ho in mente:
Risultati simili si hanno nel caso di DGP AR1. Seguono le coverages delle conf bands da filtro SD-PML per due AR con B = 0.98 e sigma= 0.01, in alto, e sigma= 0.1 in basso.
Osservo lo stesso effetto usando solo l'inverso dell'hessiano al posto dello stimatore di White. A meno di (sempre meno probabili) errori, direi che lo stimatore per la Varianza covarianza non funziona bene, nel range di N e T che abbiamo testato, quando i latenti "variano molto". Mentre le bande sono molto conservative quando i latenti non "variano troppo", ossia quando white funziona decentemente.
Se usiamo le stime della varianza covarianza da parametric bootstrap le coverages migliorano e non sembrano dipendere dalla variabilità dei latenti. Fatto solo per DGP SD, per problemi di costo computazionale (abbastanza difficili da risolvere, almeno per le coverages). Nel primo panel che segue A = 0.3, nel secondo A=3.
Ho verificato che l'information matrix equality è valida (penso che sia sempre valida per distribuzioni non fat tailed). Da ora in poi uso la sqrt della fisher (-hessian, negli ERGM) per riscalare lo score.
Assodato che il metodo di Buccheri et al per le bande di confidenza funziona quando i latenti variano poco, considero un DGP AR con sigma= 0.01
Come tentativo per rendere le bande meno conservative a T finito, ho testato la stima regolarizzata di Firth per i parametri SD. Aggiunge il determinante della info alla likelihood totale, per ridurre il bias a campione finito. Non sembra funzionare. E in effetti, non è stata proposta per migliorare la stima dell'incertezza ma ridurre il bias.
A questo punto direi che possiamo solo proporre le bande con i seguenti limiti:
Dove Aggiungerlo:
Applicazione a US congress in fondo al paper. E' necessario? Quella figura comunica che uno dei due parametri e time varying come risultato del test di Calvori
Applicazione eMid: Cosa mostreremmo?
In simulazione. Quale modello, quali tests?