kacky24 / papers

my publications and short summaries of papers I have read
3 stars 1 forks source link

DeepCas: an End-to-end Predictor of Information Cascades #21

Closed kacky24 closed 5 years ago

kacky24 commented 6 years ago

short summary

information cascadeの将来のサイズの予測のための、end-to-endのdeep learningによる手法DeepCasの提案。(この問題における初のend-to-endのdeep learningによる試み?)

*information cascade (from wikipedia) "information cascades happen when Internet users start passing on information they assume to be true, but cannot know to be true, based on information on what other users are doing"

information cascadeの予測では、特徴量を作り込んでから機械学習手法を適用していたが、deepなフレームワークにより、自動的にこれらの特徴量を抽出しつつ、且つデータの種類に寄らず使える。(特徴量を作り込む方法だと、データ依存性がある)

Imgur cascade graphから任意の始点からのランダムウォークのマルコフ連鎖を複数取り出し、それらをGRUにかけ、attentionによりグラフの表現を足し合わせ、FC層に通して予測値を得る。

cascade graph : document, path: sentence, node: word的なイメージ

Imgur node2vec, deepwalkなどでは、は固定だったが、attentionによる重み付けで、pathの長さTとサンプリング数Kも学習するような効果を与える。

結果は既存の特徴量ベース、node2vecなどを含む8つのベースラインを上回った。

特徴量ベースに比べると、中身は見辛く分析面では劣るので、特徴量ベースで精度を出す際の目標(差が特徴量の工夫により埋められる余地)として使うのがいいかもと述べられている。

比較実験を通して、特徴量の重要性の検証や可視化など、多くの確認、知見を得ている。

author

Cheng Li1 , Jiaqi Ma1 , Xiaoxiao Guo2 , Qiaozhu Mei1,2 1School of Information, University of Michigan, Ann Arbor, MI, USA 2Department of EECS, University of Michigan, Ann Arbor, MI, USA {lichengz, jiaqima, guoxiao, qmei}@umich.edu

URL

https://arxiv.org/pdf/1611.05373.pdf

year

www2017