ironhack-datalabs / datamad1020

exercises for datamad1020 bootcamp @ Ironhack Madrid
GNU Affero General Public License v3.0
2 stars 20 forks source link

[lab-unsupervised-learning] Isa Searle Riesgo #617

Closed isabel-searle closed 3 years ago

adrianacoca commented 3 years ago

Buenos días Isa!

A ver que tal se ha dado ese penultimo lab! 😬

Te comento un par de cosas: Has quitado los outliers usando los cuartiles y es un aproach bastante bueno! No obstante esto ha eliminado 108 filas de 440. Creo que muy probable que hayas eliminado datos que no eran outliers. Una manera de evitar esto sería usando el zscore de stats de tal manera que eliminas aquellos valores que tienen un z score < -3 o > 3. Te dejo un gráfico que seguro que te ayuda a visualizarlo mejor. main-qimg-f0c5dae90ee0245edc32ce18425815be El resto del lab está perfecto 🚀 Buen trabajo!!

kmeans