Closed juanelsch closed 11 months ago
Hola, estamos permitiendo utilizar solamente 5000 datos de cada clase para ese ejercicio también, aunque de ser posible utiliza el dataset completo a modo de obtener mejores resultados más adelante.
De todos modos, la vectorización por SBERT entrega vectores muy grandes, por lo que probablemente deberás solamente utilizar 10000 datos.
Saludos ✨
En la pregunta 1.2.2 dice "Finalmente, te recomendamos utilizar 5000 datos de cada clase, seleccionados de forma aleatoria." Esto se refiere para la parte de vectorización? osea que debemos usar 10.000 datos para cada vectorización, los cuales debemos almacenar en un dataframe? o para la parte de vectorización se deben utilizar todos los datos del .csv?