Python corpus output - Githubissues

matwerner / algorithms-for-datascience

Collection of projects for disciple INF2978 - Algorithms for DataScience at PUC-Rio

0 stars 0 forks source link

Duvidas:

Ainda não consegui rodar o do G1, porém quando rodei novamente para o brown, percebi que você comentou as funções que criei para baixar os dataset de forma automatica? Algum motivo especifico para isso?

Sugestões:

É possivel modificar o algoritmo para em vez da matriz resultante ser Vocab X Documents, ser Documents X Vocab? Devido a forma como estou fazendo os algoritmos em C, cada linha deveria ser um vetor documento e não um vetor palavra. Além disso, seria um pouco custoso implementar as funções para pegar essa matriz original e transpola.

matwerner / algorithms-for-datascience