giuseppeegentile / AppStatExams

1 stars 0 forks source link

Test Multivariato o Univariato #7

Closed LuigiPagani closed 5 months ago

LuigiPagani commented 6 months ago

https://github.com/giuseppeegentile/AppStatExams/blob/2b86e0ea702c1ddeccfb0c568c3cf0d2bc3ba9bb/2022/20220209/Pb2.R#L152C1-L156C27

In questo caso bisogna testare univariate normality su ogni feature p per ogni cluster g o la multivariate normality per ogni cluster g? Dato che sto facendo k=6 intervalli io direi più la prima opzione.

LuigiPagani commented 6 months ago

IC={} Ps={} for(i in 1:g){ X <- data[cluster.dl.cut==i,1] # min Y <- data[cluster.dl.cut==i,2] # artists n <- length(X) Ps <- c(Ps,shapiro.test(X)$p) Ps <- c(Ps,shapiro.test(Y)$p) x.mean <- mean(X) y.mean <- mean(Y) x.cov <- var(X) y.cov <- var(Y)

ICmeanMin <- c(inf = x.mean - sqrt(x.cov/n) qt(1 - alpha/(2k), n-1), center = x.mean, sup = x.mean + sqrt(x.cov/n) qt(1 - alpha/(2k), n-1))

ICmeanArtist <- c(inf = y.mean - sqrt(y.cov/n) qt(1 - alpha/(2k), n-1), center = y.mean, sup = y.mean + sqrt(y.cov/n) qt(1 - alpha/(2k), n-1))

IC <- rbind(IC, ICmeanMin, ICmeanArtist) } Ps IC

Io ho fatto così ma escono stessi identici intevrvalli

giuseppeegentile commented 6 months ago

Si vengono uguali perchè io uso ogni elemento della matrice mentre tu consideri tutta la matrice insieme, è equivalente il codice.

Riguardo alla normalità, penso sia sempre da intendere la multivariata, ma non ne sono sicuro.

LuigiPagani commented 5 months ago

Oggi con @ScarpMarc siamo arrivati alla seguente conclusione, con un confidence interval del 80%:

  1. Se test generiche linear combination mi serve multivariate normality.
  2. Se testo le singole componenti è sufficiene l'univariate normality.
giuseppeegentile commented 5 months ago

Quindi nel caso solito in cui chiede T2 o Bonferroni si va sempre di multivariate, giusto?

ScarpMarc commented 5 months ago

Quindi nel caso solito in cui chiede T2 o Bonferroni si va sempre di multivariate, giusto?

Per quello che ho provato i test univariate di Bonferroni sono perfettamente identici, semplicemente con il multivariate ne fai un tot alla volta. Questo perché in Bonferroni multivariate tu prendi la diagonale della matrice di covarianza, per cui è come prendere le singole varianze