Gestions valeurs manquantes

stecaron / projet-gif-7005

Ce repo a comme objectif de centraliser tous les programmes en lien avec le projet réalisé dans le cadre du cours GIF-7005 de la session d'automne 2018.

1 stars 0 forks source link

Gestions valeurs manquantes #13

Open William-Bourget opened 5 years ago

William-Bourget commented 5 years ago

Certaines valeurs sont manquantes dans le fichier qu'on doit prédire et remettre. Il faudrait savoir ce qu'on en fait.

On ne peut pas réaliser le projet sans régler le problème. pourrait faire l'affaire ? https://scikit-learn.org/stable/modules/generated/sklearn.impute.SimpleImputer.html

William-Bourget commented 5 years ago

On pourrait mettre le SimpleImputer dans la pipeline avec un most_frequent=True (au tout début de la pipeline ou bien à la fin?)

Sinon on le fait à l'extérieur de la pipeline avant de faire passer le data dedans

William-Bourget commented 5 years ago

Problème réglé : j'ai mis la moyenne au données manquantes. Selon c'est suffisant et y'a pas beaucoup de valeur ajouté à essayer de faire mieux, car il y a pas tant de données manquantes. 👍 💯