Te comento un par de cosas:
En la parte de cleaning no hace falta eliminar ninguna columna ya que en clustering no pasa nada si hay mucha correlación entre columnas. También podrías haber eliminado outliers, una manera de hacerlo sería usando el stats.zscore de tal manera que eliminas aquellos valores que tienen un z score < -3 o > 3. Te dejo un gráfico que seguro que te ayuda a visualizarlo mejor.
Aparte de esto el lab está muy bien! 🚀
Buen trabajo!!
Buenos días Candela!
A ver qué tal se ha dado ese penúltimo lab! 😬
Te comento un par de cosas: En la parte de cleaning no hace falta eliminar ninguna columna ya que en clustering no pasa nada si hay mucha correlación entre columnas. También podrías haber eliminado outliers, una manera de hacerlo sería usando el
stats.zscore
de tal manera que eliminas aquellos valores que tienen un z score< -3
o> 3
. Te dejo un gráfico que seguro que te ayuda a visualizarlo mejor.Aparte de esto el lab está muy bien! 🚀 Buen trabajo!!