This repo was created for writing a diploma.
Данный проект является аккумулятором кода и статей для написания ВКР на тему анализа данных онлайн курсов (с привязкой к приложению анализа для построения модели адаптивного обучения). В рамках осенней практики велась работа в составе команды над проектом анализу данных в рамках задачи от ЦРЭОР. Цель проекта – создать платформу для осуществления анализа данных онлайн курсов загружаемых пользователями логов. В рамках ВКР был проведен анализ данных для построения рекомендаций для студентов и методистов. Эти рекомендации должны помочь персонализировать обучение слушателей в рамках онлайн курсов. На основании сформированных моделей слушатели разделяются на группы по уровню активности и стилю обучения, а также предлагаются методы рекомендации последовательности контента и рекомендации материалов для слушаетелей, которые плохо справились с какими-либо заданиями. В этом репозитории находится код исследования, описанного в ВКР. В данный репозиторий не были загружены данные, на основании которых производился анализ.
Язык программирования: python в пакете анализа данных Anaconda
Представление данных логов: формат: JSON, описание событий: wiki, структура курса - набор файлов формата xml.
Процесс: методист загружает логи, на основании которых система проиводит анализ и выводит результат анализа.
Раздел видео: Анализ производится на основе событий видео.
Средний процент просмотра видео для каждого видео
Вывод диаграммы просмотра видео: количество просмотров каждого момента видео для каждого пользователя (интересуют моменты, которые просматривались несколько раз)
Раздел тесты: Анализ производится на основе событий контрольных тестов.
Подсчет среднего балла участников курсов в каждом тесте
Данные, полученные с платформы онлайн образования, загружаются в индекс Elasticsearch. Из xml файлов структуры курса извлекается информация о страницах, содержащих задания, для того, чтобы в дальнейшем вычислить время, потраченное пользователями на решение заданий. Далее на основании файлов логов формируются модели пользователей, после чего производятся манипуляции над моделями, описанные в тексте ВКР.