# happybirds
This is a repository for a university project. The task is to create a machine learning model to predict the sentiment of a tweet about airlines based on annotated data. We use the readme for brainstorming.
ideas:
FE extraction from RAW
CountVectorizer bigrams y trigrams
15 de June is the deadline to present boths kaggles!
Tenemos que hacer una web/blog con una explicación técnica de lo que hemos hecho --> 3 Julio. Memoria. Que sea didactico. Link al github con el codigo si es posible.
Datacleaning
exploración de datos
machine learning...
El metodo que hemos hecho para presentar el kaggle
Además de esto ver qué historias podemos extraer sobre las aerolineas.
3 Julio haremos la presentación con un ppt o similar. 2-3 min en el programa que hemos hecho + 7 min con las preguntas/conclusiones y preguntas que nos hemos hecho.
Models
Naive bayes
SVM-RBF
RF
Boosting
Visualization
How to handle the unevenly distributed dataset? See percents: