stecaron / projet-gif-7005

Ce repo a comme objectif de centraliser tous les programmes en lien avec le projet réalisé dans le cadre du cours GIF-7005 de la session d'automne 2018.
1 stars 0 forks source link

Analyse exploratoire sur les features simples #3

Open stecaron opened 5 years ago

stecaron commented 5 years ago

Faire une EDA (exploratory data analysis) sur les features classiques et simples pour voir lesquelles devraient être intégrées dans le pipeline pour tester les modèles. Ces features devraient être des données qu'on a deja a notre disposition:

Peut-être sortir des mesures de "sparsity" de documents pour ces features qui nous aiderait a voir si certains documents (types de document) sont rattachés à des features en particulier (pas facile).