[ ] Ансамбли. bagging(RandomForest и ExtraTrees). boosting (Adaboost, Gradient Boosting). Дико нелинейные закономерности. Bag-Boo и Boo-bag.
Потюнить randomforest и xgboost на higgsML.
[ ] ВТЭК. Метрики классификации. (precision, recall, accuracy, f-score, AUC). Как не выстрелить себе в ногу. Тест под камнем. Тестовый стэнд(намёк). Кроссвалидация
Зарешивание прошедшего соревнования kaggle в режиме "собери бейзлайн". По умолчанию - shelter animal outcomes.
[ ] Rapid prototyping & fail faster. Тэстовый стэнд. Continuous integration. Командная работа 101 (data engineering, feature engineering, model iterations, experiment design и почему это хорошо делать вместе).
Итерации улучшения "общего решения" командами до 4 человек. (тюнить размер по ситуации)
[ ] ранжирование, advanced boosting algorithms.
[ ] Recommender Systems - definitive guide to рекоммендации?
ML 102