TlseDataScience / meetup-cfp

Meetup Call for Paper pour soumettre vos idées de sujets
11 stars 3 forks source link

[Profil et prédiction d'occupation de stations de vélos libre-service] Damien Garaud #8

Closed garaud closed 5 years ago

garaud commented 6 years ago

Le speaker

Damien Garaud, Data Scientist & Développeur chez Oslandia

Sujet de votre conférence

Profil et prédiction d'occupation de stations de vélos libre-service

Description de votre conférence

Cette présentation est un cas pratique d'exploration et de traitement de données dont l'objectif est de prédire l'occupation des stations de vélos libre-service. Grâce aux Données Ouvertes aka Open Data de certaines métropoles comme Lyon ou Bordeaux, il est possible de récupérer des données sur l'occupation des vélos libre-service. La présentation suivra un cheminement assez logique quand on travaille avec de la donnée :

  1. récupération et formattage
  2. exploration et visualisation
  3. traitement et prédiction

Après une brève introduction à une bibliothèque Python de data pipeline, la deuxième partie montrera un cas concret de profil horaire avec l'utilisation d'un modèle de Machine Learning dit non-supervisé (KMeans). Puis nous nous concentrerons sur la préparation de la donnée appelée aussi feature engineering afin que le modèle de prédiction, ici XGBoost, puisse prévoir au mieux l'occupation de chaque station sur 1 heure par exemple.

Vous pourrez découvrir ou reconnaitre certaines bibliothèques Python qui ont été utilisées dans ce projet : luigi, pandas, seaborn, scikit-learn, folium ou xgboost.

Informations diverses

garaud commented 6 years ago