ushchent / el_machina

Машинные предсказания итогов выборов в Беларуси
http://lider.opendata.by
2 stars 1 forks source link
elections machine-learning

Избирательная машина "Лидер"

Объективные предсказания итогов выборов в Беларуси

Экспериментальный проект по созданию моделей машинного предсказания результатов выборов в нижнюю палату белорусского парламента.

В папке doc_original находятся оригинальные сообщения из архива Центральной комиссии Республики Беларусь по выборам о регистрации кандидатов в депутаты Палаты представителей и об итогах выборов в 2000 (2 тура), 2004, 2008, 2012 и 2016 годах.

В папке data находятся данные для обучения и предсказаний. Набор данных train.csv содержит информацию о зарегистрированных кандидатах на выборах 2000, 2004, 2008, 2012, 2016 годов, а также по кампаниям повторных выборов 2005 и 2014 годов и данные о (не)прохождении кандидата в парламент.

Структура набора train.csv

Структура набора test.csv

В файле находятся данные о кандидатах 2019 года. Признаки в основном те же, но есть и новые поля.

Задача

Предсказать методами машинного обучения значение признака status в наборе test.csv до 18 ноября 2019 года.

Результат

Окончательное предсказание с помощью Random Forest дало результат 83.63%: машине удалось верно предсказать 92 депутатов из 110. Для начала считаем неплохим итогом, хотя машинный метод предсказания пока безусловно проигрывает интуитивному.

Подводные камни

Количество кандидатов меняется, поэтому перфекционистам есть резон сверяться с актуальными данными ЦК.