IIC2613 / Syllabus

Repositorio oficial Inteligencia Artificial 2020-2
6 stars 1 forks source link

Entrenar por parte bc RAM #80

Open Arcoirisky opened 3 years ago

Arcoirisky commented 3 years ago

Hola! ¿Es posible entrenar un modelo por partes? Onda, hacer svc.fit(pt1_data, pt1_tag) las veces que sean necesarias o ¿necesita todo de una?

Estoy hace días peleando con colab para que me transforme parte del DataTrain en algún tipo de dato que me acepte el método SVC.

Ya intenté en darle sparse matrix, reducirla y dejarla como una ndarray, también probé directamente con el toarray() a cada elemento de sparse matrix

el reducir la dimensionalidad para dejar cada dato del sparse matrix como ndarray de 1 dimensión me sirve para hacer fit pero me es imposible el convertir todo el dataTrain. (Sin contar que google colab me borra los archivos auxiliares de cada parte después de explotar y no puedo descargarlos porque son demasiados pesados -> 3,24G)

Esto es recién con el tema de las bolsa de palabras, el W2V me causa otros problemas

Juan-AAS commented 3 years ago

Escribí unos tips, quizás te puedan servir para resolver tus problemas de memoria. Con respecto al entrenamiento por partes, tengo entendido que cada vez que vuelvas a ejecutar el entrenamiento los pesos se reinician. Sinceramente no sé como hacer para guardar los pesos y ahcer lo que deseas hacer.