IIC2433 / Syllabus-2020-2

20 stars 6 forks source link

T3 - Cuándo realizar subsampling #109

Closed fguinez closed 3 years ago

fguinez commented 3 years ago

Si deseo realizar subsampling, ¿hay algún problema con que lo realice dentro de la función de preprocesamiento? (por ejemplo, que necesiten el dataset preprocesado completo para la corrección).

Por otro lado, no logro decidir si ¿es más efectivo realizar el subsampling antes o después de normalizar los datos?. Antes de normalizar, ajustaría la normalización mejor al subsampling pero no sería tan fiel al dataset completo. Después de normalizar, mantendría una normalización fiel al dataset completo pero podría tener atributos con rangos de valores más bajos.

AstridESMJ commented 3 years ago

¡Hola!

No hay problema que vaya dentro de la función de preprocesamiento, si debes indicar claramente que está incorporada esta tarea y dar la opción de no hacer subsampling. Te recomiendo dar la opción de subsampling después de terminar todo el preprocesamiento, es decir primero dejas listo el dataset incluida la normalización y luego se hace el subsampling.

Saludos,

Astrid

fguinez commented 3 years ago

gracias!