[Machine learning incrémental: des concepts à la pratique] Max Halford

Le speaker

Max Halford, doctorant à l'IRIT et à l'IMT

Sujet de votre conférence

Machine learning incrémental: des concepts à la pratique

Description de votre conférence

De manière habituelle, mettre en place un pipeline de machine learning consiste à construire un jeu de données et à entrainer un modèle sur celui-ci. Cette pratique, qu'on appelle "batch learning", a l'inconvénient de nécessiter une puissance de calcul proportionnelle à la quantité de données. De plus, il faut généralement ré-entrainer le modèle depuis le départ dès que de nouvelles données arrivent. Ces deux pépins freinent bien souvent la mise en place du pipeline.

Une autre alternative consiste à faire du "online learning", où on utiliser des modèles qui apprennent au fur et à mesure que les données arrivent. Celà mène à des pipelines qui nécessitent très peu de puissance de calcul et qui s'adaptent au cours du temps.

Dans ce talk nous présenterons le contexte, nous détaillerons certains algorithmes, et nous discuterons des avantages et des inconvénients (spoiler: il y en a peu!). Enfin nous présenterons une toute nouvelle librairie d'online learning qui a ses origines à Toulouse.

Informations diverses

Thématique, Labels : online learning, découverte
Niveau de difficulté (débutant|avancé|confirmé) : avancé
Durée (quickie 15-30min, conférence >1h) : Entre 1h et 1h30
Format (slides, live-coding, les deux): Slides
Dispo ou indispo (après mars, dès que possible, pas entre X et Y): A partir de mi-février

TlseDataScience / meetup-cfp