Open HaraHeique opened 4 years ago
Commits com a lógica de obter o tamanho da maior frase no dataframe criado a partir do dataset: 49d5495a1356f477c31a3ec953bc910f6bf0b530
@Fideliszan o gráfico resultante de histograma das frequências do tamanho das palavras.
Fazer os seguintes testes:
Baseado no novo histograma irei utilizar max_seq_length:
Percebe-se que não houve muita variação. Porém o estranho que tem uma frase com tamanho 951 após o pré-processamento.
@Fideliszan,
Contar as palavras de cada frase do dataset pra ver se a escolha do parâmetro 35 palavras máximas por frase é boa. Provavelmente não será, pois existem frases que devem conter mais de 50 palavras.