Open Fernanda-Bley opened 2 months ago
Si te fijas, las dimensiones estan entre 1 y 784. Esas son los atributos del dataframe / las columnas de sample_X.
Si se te esta demorando mucho (esto pasa cuando uno trabaja con datos), que estrategia puedes usar para trabajar con menos datos primero, probar que todo funciona, estimar cuanto se demora en correr, y luego dejar el compu prendido un buen rato?
Hola profesor. Espero que se encuentre bien. Me pasa lo mismo. Deje el pc un dia y seguía. Que puedo hacer?
Partir por debuggear, como podrias armar un entorno lo mas similar posible a tu codigo pero que se demore poco?
Las instrucciones son:
dim4 = [] Para i entre 1 y 4: Sea j la dimensión (entre 1 y 784, sin contar las dimensiones que ya están en dim4) tales que clusterizar con j y las dimensiones en dim4 entrega el mejor silhouette score. Agregar j a dim4.
No sé a que se refiere por "dimension" ¿Se refiere a la fila j del sample X? o a otra cosa. Todo lo que intentado no tiene sentido o se demora demasiado en correr.