BioR-Valencia / epilepsia_challenge

MIT License
0 stars 0 forks source link

Make an EDA (Exploratory Data Analysis) #3

Open jmjaenlorites opened 1 year ago

jmjaenlorites commented 1 year ago

He visto que hay valores NaN y cosas raras en algunos casos. Estaría guay identificarlas y ver que hacemos con ellas. NaNs seguramente quitemos, pero al igual vemos algo guay con el EDA

Just in case, EDA es básicamente estudiar un poco los datos para ver que hay, sacar algunos estadísticos y plots para entender mejor con que estamos trabajando

RobertoTCo commented 1 year ago

Cosas a sacar con el EDA:

  1. Errores que nos pueda fastidiar (missings, problemas del remuestreado que hicieron...)
  2. Distribuciones de las medidas para cada paciente + respecto a las etiquetas de los segmentos boxplots + densidad distr
  3. Algunos plots para ver posibles correlaciones etc scatter plots + r2 (ggally)
  4. ...

Resultado del EDA:

a. Evaluar si es necesario, positivo y posible interpolar los datos faltantes y cuál estrategia b. Evaluar qué hicieron para el remuestreado y si puede afectar a las predicciones (poco prioritario) c. Identificar posibles outliers (clinicos) - en literatura - y estadisticos (para cada paciente) para que no nos fastidie la normalizacion para la DL. d. Valorar el potencial de hacer feature selection. Se puede ver con los scatter plots + regresiones multivariables e. Comprender las diferencias entre los distintos pacientes. Evaluar si es mejor un modelo general o modelos individualizados.