Machine learning incrémental: des concepts à la pratique
Description de votre conférence
De manière habituelle, mettre en place un pipeline de machine learning consiste à construire un jeu de données et à entrainer un modèle sur celui-ci. Cette pratique, qu'on appelle "batch learning", a l'inconvénient de nécessiter une puissance de calcul proportionnelle à la quantité de données. De plus, il faut généralement ré-entrainer le modèle depuis le départ dès que de nouvelles données arrivent. Ces deux pépins freinent bien souvent la mise en place du pipeline.
Une autre alternative consiste à faire du "online learning", où on utiliser des modèles qui apprennent au fur et à mesure que les données arrivent. Celà mène à des pipelines qui nécessitent très peu de puissance de calcul et qui s'adaptent au cours du temps.
Dans ce talk nous présenterons le contexte, nous détaillerons certains algorithmes, et nous discuterons des avantages et des inconvénients (spoiler: il y en a peu!). Enfin nous présenterons une toute nouvelle librairie d'online learning qui a ses origines à Toulouse.
Informations diverses
Thématique, Labels : online learning, découverte
Niveau de difficulté (débutant|avancé|confirmé) : avancé
Durée (quickie 15-30min, conférence >1h) : Entre 1h et 1h30
Format (slides, live-coding, les deux): Slides
Dispo ou indispo (après mars, dès que possible, pas entre X et Y): A partir de mi-février
Le speaker
Max Halford, doctorant à l'IRIT et à l'IMT
Sujet de votre conférence
Machine learning incrémental: des concepts à la pratique
Description de votre conférence
De manière habituelle, mettre en place un pipeline de machine learning consiste à construire un jeu de données et à entrainer un modèle sur celui-ci. Cette pratique, qu'on appelle "batch learning", a l'inconvénient de nécessiter une puissance de calcul proportionnelle à la quantité de données. De plus, il faut généralement ré-entrainer le modèle depuis le départ dès que de nouvelles données arrivent. Ces deux pépins freinent bien souvent la mise en place du pipeline.
Une autre alternative consiste à faire du "online learning", où on utiliser des modèles qui apprennent au fur et à mesure que les données arrivent. Celà mène à des pipelines qui nécessitent très peu de puissance de calcul et qui s'adaptent au cours du temps.
Dans ce talk nous présenterons le contexte, nous détaillerons certains algorithmes, et nous discuterons des avantages et des inconvénients (spoiler: il y en a peu!). Enfin nous présenterons une toute nouvelle librairie d'online learning qui a ses origines à Toulouse.
Informations diverses