tatchiwiggers / mi-person-legacy

0 stars 0 forks source link

Testar modelos #3

Closed tatchiwiggers closed 2 years ago

tatchiwiggers commented 2 years ago

Professors suggestion: use CountVectorizer and TF-IDF;

For CountVectorizer (Bag of words):

For a TF-IDF Model:

For a Random Forest Model

tree-regression drawio

For a Naive Bayes Model:

The Naive Bayes algorithm is a supervised machine learning algorithm based on the Bayes' theorem. It is a probabilistic classifier that is often used in NLP tasks like sentiment analysis (identifying a text corpus' emotional or sentimental tone or opinion. HOWEVER, Naive Bayes Model works particularly well with text classification and spam filtering.

tatchiwiggers commented 2 years ago

Modelo NÃO estpa overfitting, porém foi testado com os labels incorretos gerando resultados imprecisos. CONSERTAR.

tatchiwiggers commented 2 years ago

Modelo RNN Testando em média 85%. 👯‍♂️ Preciso fazer ele rodar corretamente com nosso dataset que depois de processado agora está testando 100%.... 😥

tatchiwiggers commented 2 years ago

Modelo de Regressão Linear Após o "re-preprocessamento" do dataset está testando em média 88% nos três sentimentos: NEUTRAL, POSITIVE and NEGATIVE.

tatchiwiggers commented 2 years ago

Modelo RandomForestClassifier testando somente 39% 😥

tatchiwiggers commented 2 years ago

Decido pelo modelo pré-treinado VADER. Vamos adicionar alguns features para dar mais precisão à análise, como tradução de emojis e algumas gírias. 🤖