ironhack-datalabs / datamad1020

exercises for datamad1020 bootcamp @ Ironhack Madrid
GNU Affero General Public License v3.0
2 stars 20 forks source link

[lab-unsupervised-learning] Edu Oporto #625

Closed EduOporto closed 3 years ago

adrianacoca commented 3 years ago

Buenos días Edu!

A ver que tal se ha dado ese penultimo lab! 😬

Te comento un par de cosas: Has quitado los outliers usando los cuartiles y es un aproach bastante bueno! No obstante esto ha eliminado muchas filas. Creo que muy probable que hayas . Una manera de evitar eliminar datos que no eran outliers sería usando el zscore de stats de tal manera que eliminas aquellos valores que tienen un z score < -3 o > 3. Te dejo un gráfico que seguro que te ayuda a visualizarlo mejor. main-qimg-f0c5dae90ee0245edc32ce18425815be

El resto del lab está perfecto 🚀 Buen trabajo!!

kmeans