goto-ru / Basic_ML

A work in progress towards stacking all the data science, data management and machine learning training materials [in russian].
5 stars 4 forks source link

ML-track

A work in progress towards stacking all the data science, data management and machine learning training materials [in russian].

Мини-курс по вводной в машинку.

[тут надо рассказать про науку о данных, нафига она нужна и примеры крутых кейсов, которые решает машобучение]

  1. Работа с данными. Титаник. Чисто инженерный семинар, который знакомит с данными и инструментами для работы с ними.

[тут надо рассказать про то, что такое машинка, классификация и регрессия, как работает KNN, линейные модели на пальцах, намёк на валидацию]

  1. Моя первая машинка в sklearn. Скорее памятка, чем семинар. Давать вместе с (4) если группа обычная, (3) если все Ъ-математики.
  2. Пишем линейную регрессию сами & Diabetes
  3. Оверфиттинг и регуляризация
  4. Работа с текстом и feature engineering

[тут нужно рассказать про принцип работы деревьев и затравку про ансамбли]

  1. решающие деревья
  2. Higgs - пример рыбы для проекта. Сюда можно запихнуть любой проект с каггла, в идеале - сообразно предпочтениям ученика.

Расширения и дополнения