ironhack-datalabs / datamad1020

exercises for datamad1020 bootcamp @ Ironhack Madrid
GNU Affero General Public License v3.0
2 stars 20 forks source link

[lab-unsupervised-learning} Candela García #621

Closed canbot92 closed 3 years ago

adrianacoca commented 3 years ago

Buenos días Candela!

A ver qué tal se ha dado ese penúltimo lab! 😬

Te comento un par de cosas: En la parte de cleaning no hace falta eliminar ninguna columna ya que en clustering no pasa nada si hay mucha correlación entre columnas. También podrías haber eliminado outliers, una manera de hacerlo sería usando el stats.zscore de tal manera que eliminas aquellos valores que tienen un z score < -3 o > 3. Te dejo un gráfico que seguro que te ayuda a visualizarlo mejor. main-qimg-f0c5dae90ee0245edc32ce18425815be

Aparte de esto el lab está muy bien! 🚀 Buen trabajo!!

kmeans