Open William-Bourget opened 5 years ago
On pourrait mettre le SimpleImputer dans la pipeline avec un most_frequent=True (au tout début de la pipeline ou bien à la fin?)
Sinon on le fait à l'extérieur de la pipeline avant de faire passer le data dedans
Problème réglé : j'ai mis la moyenne au données manquantes. Selon c'est suffisant et y'a pas beaucoup de valeur ajouté à essayer de faire mieux, car il y a pas tant de données manquantes. 👍 💯
Certaines valeurs sont manquantes dans le fichier qu'on doit prédire et remettre. Il faudrait savoir ce qu'on en fait.
On ne peut pas réaliser le projet sans régler le problème. pourrait faire l'affaire ? https://scikit-learn.org/stable/modules/generated/sklearn.impute.SimpleImputer.html