Journal/Conference: ACL2020
Title: GCAN: Graph-aware Co-Attention Networks for Explainable Fake News Detection on Social Media
Authors: Yi-Ju Lu, Cheng-Te Li
URL: https://arxiv.org/abs/2004.11648
Intro
問題1:SNSのテキストは短いため、データがスパース
問題2:判断のためにユーザのコメントを豊富に取得する必要
→多くのユーザは単に共有するだけ
問題3:カスケードの経路を取得するのはコストがかかる:Cheng-Te Li, Yu-Jen Lin, and Mi-Yen Yeh. 2018. Fore- casting participants of information diffusion on so- cial networks with its applications. Information Sci- ences, 422:432 – 446.
問題4:説明性がほしい dEFENDなどはそれに対処してるが,長いソーステキストが必要
0. 論文
Journal/Conference: ACL2020 Title: GCAN: Graph-aware Co-Attention Networks for Explainable Fake News Detection on Social Media Authors: Yi-Ju Lu, Cheng-Te Li URL: https://arxiv.org/abs/2004.11648
1. どんなもの?
そのニュースのカスケードからフェイクかどうかを判定する問題. 取得しやすい情報 (ソース投稿 + RTユーザ)から,フェイクかどうかを判定し,Attentionを用いることで解釈性 (どこを注目したのか)を理解しようとする研究
2. 先行研究と比べてどこがすごい?
dEFEND (KDD2019)の正統な続編っていうかんじ. 入力として必要な情報をdEFENDよりも減らして,Attentionをうまく活用しようとしている.
3. 技術や手法のキモはどこ?
4. どうやって有効だと検証した?
Twitter15, Twitter16のデータセットを用いて実験.
5. 議論はある?
・ちゃんと,テキスト情報の重要な部分,拡散初期からのユーザにおける重要な部分を取得できている
・比較手法の精度が低い (元論文や自分がやった時よりも低い) ・今回のモデルでは,Attenionの効果が想定以上にあるらしい
6.次に読むべき論文は?
メモ
現実的なシナリオでのフェイクニュース検出 [元の投稿 + RTユーザのリスト]から → [フェイクかどうかの判断 + 疑わしいユーザとそのテキストを生成] Graph-aware Co-attention networks (GCAN)を提案
Intro 問題1:SNSのテキストは短いため、データがスパース 問題2:判断のためにユーザのコメントを豊富に取得する必要 →多くのユーザは単に共有するだけ 問題3:カスケードの経路を取得するのはコストがかかる:Cheng-Te Li, Yu-Jen Lin, and Mi-Yen Yeh. 2018. Fore- casting participants of information diffusion on so- cial networks with its applications. Information Sci- ences, 422:432 – 446. 問題4:説明性がほしい dEFENDなどはそれに対処してるが,長いソーステキストが必要
提案手法:GCAN 特徴 ・ソースツイート + 他のユーザコメントなし + ネットワーク構造無しでフェイクニュースを検出 ・説明可能な根拠を提示:怪しいRTユーザを提示,attentionが払われるテキストを抽出 手法 ユーザの特徴量 + ソーステキストからembedding → CNN + RNN +GNN dual co-attention mechanismの採用:ソース投稿とRT構造の関係や,ソースツイートとユーザの関係といった2つの関係を学習するため
3 Problem Statement 入力:source tweet (s) + user-features (x_j, time) → fake or not (y) + highlight user & words
4 Model 5つの構成要素 ・4.1 ユーザの特徴抽出:11の特徴量 ・4.2 source tweetのencoding:GRUのencoding ・ユーザの伝搬表現 4.3 user propagation representation 最初の投稿からnユーザまでの特徴を学習 ・GRU-badsed ・CNN-based 4.4 Graph-aware Propagation Representation ユーザ同士のcosine距離をweightとしてグラフを作成しGNNで学習 ・4.5 dual co-attention: tweetとユーザの関係 Source-Propagation : 伝搬を行ったRTユーザ (GRU) とソースツイートのCo-Attentionを Source-Interaction: 伝搬を行ったRTユーザ (GNN) とソースツイートのCo-Attentionを ・4.6 prediction module
5 Experiments 比較手法の精度が元論文よりもかなり低い やっぱりEarly Detectionの調査は必要?
5.2 Ablation analysis: Co-attentionによる精度向上効果が高すぎる 5.3 説明性の可視化例 ・breakingとか入っているニュースはたしかにfakeっぽいよね ・Trueを判定する際に拡散初期のユーザから判断している→むしろ、Fakeを判定する際に用いられるものだと思っていた コード:https://github.com/l852888/GCAN