IIC2115 / Syllabus

27 stars 7 forks source link

Duda laboratorio 3, parte 2b: balance de datos #18

Open sebaencina opened 1 month ago

sebaencina commented 1 month ago

En la parte 2 b nos piden que hagamos un balance de datos por medio de técnicas reductivas o generativas, sin embargo no encontré nada sobre eso en los apuntes o ayudantías. Le pregunté a chat y me dio métodos de la librería imblearn.under_sampling y imblearn.over_sampling. ¿Se puede usar?

trinipeters commented 1 month ago

También tengo dudas en esta! Uno tiene que usar el data frame con la preparacion de datos? o el original? Porque si no no se me ocurre como se podría hacer si fueron reemplazados los datos nulos. Gracias!

plourido commented 1 month ago

Hola @sebaencina y @trinipeters, espero que se encuentren muy bien. Lo que comentas de usar esas librerías está bien, pero siempre debes explicar o justificar que realiza y para que la vas a utilizar. No sirve "el chat me dijo", si no que, si el chat te dice, puedes investigar sobre eso y luego implementarlo. Respecto a la duda de @trinipeters, tienes que hacer un balance de datos.

Espero haberte ayudado :)

Saludos

clementerenones commented 1 month ago

Hola! Otra pregunta en este inciso. El balance reductivo se refiere a que cada una de las clases con mayor número de muestras deben pasar a tener le mismo número de la clase minoritaria o que el conjunto total de todas las clases con más muestras sumen el número de muestras de la minoritaria? Gracias!