IIC2613 / Syllabus

Repositorio oficial Inteligencia Artificial 2020-2
6 stars 1 forks source link

Tarea 3: Actividad 2 #70

Open JuaniAndres opened 3 years ago

JuaniAndres commented 3 years ago

Hola una duda a que se refieren con "comente intuitivamente sobre las transformaciones realizadas y agregue ejemplos representativos" no entiendo muy bien lo que se espera especialmente que ejemplos tenemos que poner. Gracias de antemano

Juan-AAS commented 3 years ago

Hola, en esta parte se espera que hagan el preprocesamiento (Limpieza de datos y codificación) y comenten sobre lo que hicieron. La parte del 'intuitivamente' se espera que comenten la intuición acerca de BoW y Word2Vec como funcionan y que se obtiene de ellas. No es necesario que entren tanto en detalle, pero sí que sepan de que trata cada uno. No es necesario que entren tanto en detalle. Po último, respecto a los ejemplos: es más o menos lo que aparece en el enunciado, pueden tomar un texto y codificarlo y mostrar el texro y su vector que lo representa.

Espero haber resuelto tu duda.

JuaniAndres commented 3 years ago

Perfecto me quedo mucho más claro muchas gracias

jitorcas commented 3 years ago

Hola @JAAS1993!

Estoy un poco perdido con lo que me retorna BOW. Tengo una lista con todas los textos de las noticias limpios, al vectorizarla, transformarla y pasarlo a un array, me genera uno de dimensiones (44898, 107018). ¿Esto quiere decir que las filas son los textos de las noticias y las columnas equivalen a las palabras que tengo en mi vocabulario (en este caso 107018)?

En caso de ser cierto lo de arriba, ¿podría considerar disminuir el vocabulario?

Muchas gracias!

Juan-AAS commented 3 years ago

Hola, Puedes disminuir el Vocabulario o mejor aún puedes reducir la dimensionalidad. En el Issue #81 puse unos tips para hacer esta reducción de dimensionalidad para BoW especificamente.