GCAN: Graph-aware Co-Attention Networks for Explainable Fake News Detection on Social Media

0. 論文

Journal/Conference: ACL2020 Title: GCAN: Graph-aware Co-Attention Networks for Explainable Fake News Detection on Social Media Authors: Yi-Ju Lu, Cheng-Te Li URL: https://arxiv.org/abs/2004.11648

1. どんなもの？

そのニュースのカスケードからフェイクかどうかを判定する問題．取得しやすい情報 (ソース投稿 + RTユーザ)から，フェイクかどうかを判定し，Attentionを用いることで解釈性 (どこを注目したのか)を理解しようとする研究

2. 先行研究と比べてどこがすごい？

dEFEND (KDD2019)の正統な続編っていうかんじ．入力として必要な情報をdEFENDよりも減らして，Attentionをうまく活用しようとしている．

3. 技術や手法のキモはどこ？

4. どうやって有効だと検証した？

Twitter15, Twitter16のデータセットを用いて実験．

5. 議論はある？

・ちゃんと，テキスト情報の重要な部分，拡散初期からのユーザにおける重要な部分を取得できている

・比較手法の精度が低い (元論文や自分がやった時よりも低い) ・今回のモデルでは，Attenionの効果が想定以上にあるらしい

6.次に読むべき論文は？

メモ

現実的なシナリオでのフェイクニュース検出 [元の投稿 + RTユーザのリスト]から → [フェイクかどうかの判断 + 疑わしいユーザとそのテキストを生成] Graph-aware Co-attention networks (GCAN)を提案

Intro 問題1：SNSのテキストは短いため、データがスパース問題2：判断のためにユーザのコメントを豊富に取得する必要 →多くのユーザは単に共有するだけ問題3：カスケードの経路を取得するのはコストがかかる：Cheng-Te Li, Yu-Jen Lin, and Mi-Yen Yeh. 2018. Fore- casting participants of information diffusion on so- cial networks with its applications. Information Sci- ences, 422:432 – 446. 問題4：説明性がほしい dEFENDなどはそれに対処してるが，長いソーステキストが必要

提案手法：GCAN 特徴・ソースツイート + 他のユーザコメントなし + ネットワーク構造無しでフェイクニュースを検出・説明可能な根拠を提示：怪しいRTユーザを提示，attentionが払われるテキストを抽出手法ユーザの特徴量 + ソーステキストからembedding → CNN + RNN +GNN dual co-attention mechanismの採用：ソース投稿とRT構造の関係や，ソースツイートとユーザの関係といった2つの関係を学習するため

3 Problem Statement 入力：source tweet (s) + user-features (x_j, time) → fake or not (y) + highlight user & words

4 Model 5つの構成要素・4.1 ユーザの特徴抽出：11の特徴量・4.2 source tweetのencoding：GRUのencoding ・ユーザの伝搬表現 4.3 user propagation representation 最初の投稿からnユーザまでの特徴を学習・GRU-badsed ・CNN-based 4.4 Graph-aware Propagation Representation ユーザ同士のcosine距離をweightとしてグラフを作成しGNNで学習・4.5 dual co-attention: tweetとユーザの関係 Source-Propagation : 伝搬を行ったRTユーザ (GRU) とソースツイートのCo-Attentionを Source-Interaction: 伝搬を行ったRTユーザ (GNN) とソースツイートのCo-Attentionを・4.6 prediction module

5 Experiments 比較手法の精度が元論文よりもかなり低いやっぱりEarly Detectionの調査は必要？

5.2 Ablation analysis: Co-attentionによる精度向上効果が高すぎる 5.3 説明性の可視化例・breakingとか入っているニュースはたしかにfakeっぽいよね・Trueを判定する際に拡散初期のユーザから判断している→むしろ、Fakeを判定する際に用いられるものだと思っていたコード：https://github.com/l852888/GCAN

hkefka385 / paper_reading