Closed tatchiwiggers closed 2 years ago
Modelo NÃO estpa overfitting, porém foi testado com os labels incorretos gerando resultados imprecisos. CONSERTAR.
Modelo RNN Testando em média 85%. 👯♂️ Preciso fazer ele rodar corretamente com nosso dataset que depois de processado agora está testando 100%.... 😥
Modelo de Regressão Linear Após o "re-preprocessamento" do dataset está testando em média 88% nos três sentimentos: NEUTRAL, POSITIVE and NEGATIVE.
Modelo RandomForestClassifier
testando somente 39% 😥
Decido pelo modelo pré-treinado VADER. Vamos adicionar alguns features para dar mais precisão à análise, como tradução de emojis e algumas gírias. 🤖
Professors suggestion: use CountVectorizer and TF-IDF;
For CountVectorizer (Bag of words):
For a TF-IDF Model:
max_df
,min_df
,max_features
andngram_range
;For a Random Forest Model
For a Naive Bayes Model:
The Naive Bayes algorithm is a supervised machine learning algorithm based on the Bayes' theorem. It is a probabilistic classifier that is often used in NLP tasks like sentiment analysis (identifying a text corpus' emotional or sentimental tone or opinion. HOWEVER, Naive Bayes Model works particularly well with text classification and spam filtering.