Open JuaniAndres opened 3 years ago
Hola, en esta parte se espera que hagan el preprocesamiento (Limpieza de datos y codificación) y comenten sobre lo que hicieron. La parte del 'intuitivamente' se espera que comenten la intuición acerca de BoW y Word2Vec como funcionan y que se obtiene de ellas. No es necesario que entren tanto en detalle, pero sí que sepan de que trata cada uno. No es necesario que entren tanto en detalle. Po último, respecto a los ejemplos: es más o menos lo que aparece en el enunciado, pueden tomar un texto y codificarlo y mostrar el texro y su vector que lo representa.
Espero haber resuelto tu duda.
Perfecto me quedo mucho más claro muchas gracias
Hola @JAAS1993!
Estoy un poco perdido con lo que me retorna BOW. Tengo una lista con todas los textos de las noticias limpios, al vectorizarla, transformarla y pasarlo a un array, me genera uno de dimensiones (44898, 107018). ¿Esto quiere decir que las filas son los textos de las noticias y las columnas equivalen a las palabras que tengo en mi vocabulario (en este caso 107018)?
En caso de ser cierto lo de arriba, ¿podría considerar disminuir el vocabulario?
Muchas gracias!
Hola, Puedes disminuir el Vocabulario o mejor aún puedes reducir la dimensionalidad. En el Issue #81 puse unos tips para hacer esta reducción de dimensionalidad para BoW especificamente.
Hola una duda a que se refieren con "comente intuitivamente sobre las transformaciones realizadas y agregue ejemplos representativos" no entiendo muy bien lo que se espera especialmente que ejemplos tenemos que poner. Gracias de antemano