No script src/ml/data.py, o método filter_terms é responsável pela filtragem dos métodos, porém após a filtragem há um número grande de termos ainda.
Uma opção é ordernar os termos pelos pesos do TFIDF e então usar os termos com maiores pesos, fazendo com que a lista de termos tenha o mesmo tamanho que a lista de debtags.
No script src/ml/data.py, o método filter_terms é responsável pela filtragem dos métodos, porém após a filtragem há um número grande de termos ainda.
Uma opção é ordernar os termos pelos pesos do TFIDF e então usar os termos com maiores pesos, fazendo com que a lista de termos tenha o mesmo tamanho que a lista de debtags.