Объективные предсказания итогов выборов в Беларуси
Экспериментальный проект по созданию моделей машинного предсказания результатов выборов в нижнюю палату белорусского парламента.
В папке doc_original находятся оригинальные сообщения из архива Центральной комиссии Республики Беларусь по выборам о регистрации кандидатов в депутаты Палаты представителей и об итогах выборов в 2000 (2 тура), 2004, 2008, 2012 и 2016 годах.
В папке data находятся данные для обучения и предсказаний. Набор данных train.csv содержит информацию о зарегистрированных кандидатах на выборах 2000, 2004, 2008, 2012, 2016 годов, а также по кампаниям повторных выборов 2005 и 2014 годов и данные о (не)прохождении кандидата в парламент.
В файле находятся данные о кандидатах 2019 года. Признаки в основном те же, но есть и новые поля.
Предсказать методами машинного обучения значение признака status в наборе test.csv до 18 ноября 2019 года.
Окончательное предсказание с помощью Random Forest дало результат 83.63%: машине удалось верно предсказать 92 депутатов из 110. Для начала считаем неплохим итогом, хотя машинный метод предсказания пока безусловно проигрывает интуитивному.
Количество кандидатов меняется, поэтому перфекционистам есть резон сверяться с актуальными данными ЦК.