ML-track
A work in progress towards stacking all the data science, data management and machine learning training materials [in russian].
Мини-курс по вводной в машинку.
[тут надо рассказать про науку о данных, нафига она нужна и примеры крутых кейсов, которые решает машобучение]
- Работа с данными. Титаник. Чисто инженерный семинар, который знакомит с данными и инструментами для работы с ними.
[тут надо рассказать про то, что такое машинка, классификация и регрессия, как работает KNN, линейные модели на пальцах, намёк на валидацию]
- Моя первая машинка в sklearn. Скорее памятка, чем семинар. Давать вместе с (4) если группа обычная, (3) если все Ъ-математики.
- Пишем линейную регрессию сами & Diabetes
- Оверфиттинг и регуляризация
- Работа с текстом и feature engineering
[тут нужно рассказать про принцип работы деревьев и затравку про ансамбли]
- решающие деревья
- Higgs - пример рыбы для проекта. Сюда можно запихнуть любой проект с каггла, в идеале - сообразно предпочтениям ученика.
Расширения и дополнения