Open AkihikoWatanabe opened 2 years ago
EMNLP'14のWorkshop論文。引用数が120件とかなり多め。
MOOCsのclickstreamデータから、numericalなfeatureを作成。SVMに食わせて学習し、Dropout Predictionを行なっている。
psychologyのMOOCコースからデータ収集。12週に渡って講義が行われる。統計量は以下: 初週のユーザ数:11,607 最後の週まで残ったユーザ数:3,861 参加した全体のユーザ数:20,828 DropOut率:81.4% コース自体は19週間受講可能なので、その間のデータがある。
dropoutか否かのラベルは、翌週にターゲットユーザのIDと紐づいたアクティビティがあるかどうかで判断。ユーザuの各週Wiに対して、i=1, ..., 19の +1 / -1 ラベルが付与される。 +1 がDropout, -1がNo Dropout。
特徴量:
最初の1 -- 9週の間は、あまりDropoutが予測できないが、それ以後はhistory featureが効いて予測ができるようになる。
https://aclanthology.org/W14-4111.pdf