Closed LuigiPagani closed 5 months ago
IC={} Ps={} for(i in 1:g){ X <- data[cluster.dl.cut==i,1] # min Y <- data[cluster.dl.cut==i,2] # artists n <- length(X) Ps <- c(Ps,shapiro.test(X)$p) Ps <- c(Ps,shapiro.test(Y)$p) x.mean <- mean(X) y.mean <- mean(Y) x.cov <- var(X) y.cov <- var(Y)
ICmeanMin <- c(inf = x.mean - sqrt(x.cov/n) qt(1 - alpha/(2k), n-1), center = x.mean, sup = x.mean + sqrt(x.cov/n) qt(1 - alpha/(2k), n-1))
ICmeanArtist <- c(inf = y.mean - sqrt(y.cov/n) qt(1 - alpha/(2k), n-1), center = y.mean, sup = y.mean + sqrt(y.cov/n) qt(1 - alpha/(2k), n-1))
IC <- rbind(IC, ICmeanMin, ICmeanArtist) } Ps IC
Io ho fatto così ma escono stessi identici intevrvalli
Si vengono uguali perchè io uso ogni elemento della matrice mentre tu consideri tutta la matrice insieme, è equivalente il codice.
Riguardo alla normalità, penso sia sempre da intendere la multivariata, ma non ne sono sicuro.
Oggi con @ScarpMarc siamo arrivati alla seguente conclusione, con un confidence interval del 80%:
Quindi nel caso solito in cui chiede T2 o Bonferroni si va sempre di multivariate, giusto?
Quindi nel caso solito in cui chiede T2 o Bonferroni si va sempre di multivariate, giusto?
Per quello che ho provato i test univariate di Bonferroni sono perfettamente identici, semplicemente con il multivariate ne fai un tot alla volta. Questo perché in Bonferroni multivariate tu prendi la diagonale della matrice di covarianza, per cui è come prendere le singole varianze
https://github.com/giuseppeegentile/AppStatExams/blob/2b86e0ea702c1ddeccfb0c568c3cf0d2bc3ba9bb/2022/20220209/Pb2.R#L152C1-L156C27
In questo caso bisogna testare univariate normality su ogni feature p per ogni cluster g o la multivariate normality per ogni cluster g? Dato che sto facendo k=6 intervalli io direi più la prima opzione.