IIC2613 / Syllabus

Repositorio oficial Inteligencia Artificial 2020-2
6 stars 1 forks source link

Tarea 3: Training set para preprocesamiento #65

Open furcelay opened 3 years ago

furcelay commented 3 years ago

Hola!

Recién estoy comenzando con la tarea y me he dado cuenta de que el preprocesamiento también requiere un training set para definir como es la conversión de palabras a vectores. Como todos los sets requieren este preprocesamiento, mi duda es:

Gracias!

Juan-AAS commented 3 years ago

Como lo hablamos en la ayudantía, puedes usar un porcentaje del dataset para realizar este entrenamiento para las codificaciones o usar todo el dataset. Puedes también, hacer una selección de usar como entrenamiento aquellos textos más largos para asegurarse de tener un buen vocabulario (se me acaba de ocurrir esta idea, puedes ir probando).

y sí, puedes definir en un principio la division del dataset y tu set de entrenamiento lo puedes usar para la codificación y luego para entrenar el modelo.