Projet scolaire basé sur le Kaggle HR Analytics Case Study.
Ce projet contient plusieurs dossiers et notebooks jupyters.
Liste des dossiers :
Base Data :
- Données fournies par l'école
Datasets :
- Données traitées
Models :
- Modèles créés
Les fichiers notebook contiennent les requirements nécessaires à leur fonctionnement.
Ils sont à exécuter dans l'ordre afin d'obtenir les résultats complets.
Trois librairies sont utilisées pour créer les modèles :
Chaque librairie fournit des résultats concluants. Certains modèles ont été travaillés avec un SMOTE-NC afin d'augmenter artificiellement la taille du dataset, celui-ci étant déséquilibré.
La représentation des données via des graphiques se fait grâce à la librairie ipyvizzu. Les graphiques étant tous animés, il se peut que les notebooks soient lents sur votre machine.
Le fichier 1.1 Clustering.ipynb
est un essai de différentes technologies telles que :
Merci à @pyjaman16 et @MichelPierrel pour leur participation sur le projet en fournissant le notebook sur Scikit. La conclusion de ce projet est une rédaction commune.