IIC2433 / Syllabus-2021-2

27 stars 12 forks source link

[Tarea 3] [2.c] Number of labels is 1. Valid values are 2 to n_samples - 1 (inclusive) #27

Open PDominguezW opened 3 years ago

PDominguezW commented 3 years ago

Cuando intento hacer la iteración para la primera dimensión. Recibo el error 'ValueError: Number of labels is 1. Valid values are 2 to n_samples - 1 (inclusive)'. Estuve investigando y no se puede calcular el vector que se utiliza para calcular el silhouette_score tiene solo una dimensión. Que puedo hacer?

cjones27 commented 3 years ago

Hola, no soy ayudante pero tuve el mismo problema. Ese error lo tira cuando al clusterizar encuentra solo un cluster y corres silouette score sobre ese único cluster. Silhouette score solo se puede calcular con un número de clusters mayor o igual a 2.

Tomas-GrayD commented 3 years ago

Hola! de que forma lo pudieron solucionar? me sigue apareciendo cuando el sillhouse_score tiene 2 dimensiones

juanreutter commented 3 years ago

Tomas, no tiene que ver con las dimensiones. Si corres un dataset X (tenga las dimensiones que tenga) pero tal que X en realidad son puros vectores iguales, entonces kmeans te va a tirar un puro cluster y no vas a poder aplicar el score, tienes que filtrar eso antes, por ejemplo viendo antes del score que efectivamente tengas mas de un cluster