hkefka385 / paper_reading

3 stars 1 forks source link

GCAN: Graph-aware Co-Attention Networks for Explainable Fake News Detection on Social Media #5

Open hkefka385 opened 4 years ago

hkefka385 commented 4 years ago

0. 論文

Journal/Conference: ACL2020 Title: GCAN: Graph-aware Co-Attention Networks for Explainable Fake News Detection on Social Media Authors: Yi-Ju Lu, Cheng-Te Li URL: https://arxiv.org/abs/2004.11648

1. どんなもの?

そのニュースのカスケードからフェイクかどうかを判定する問題. 取得しやすい情報 (ソース投稿 + RTユーザ)から,フェイクかどうかを判定し,Attentionを用いることで解釈性 (どこを注目したのか)を理解しようとする研究

2. 先行研究と比べてどこがすごい?

dEFEND (KDD2019)の正統な続編っていうかんじ. 入力として必要な情報をdEFENDよりも減らして,Attentionをうまく活用しようとしている.

スクリーンショット 2020-05-20 12 11 42

3. 技術や手法のキモはどこ?

4. どうやって有効だと検証した?

Twitter15, Twitter16のデータセットを用いて実験.

5. 議論はある?

・ちゃんと,テキスト情報の重要な部分,拡散初期からのユーザにおける重要な部分を取得できている

スクリーンショット 2020-05-20 12 12 05

・比較手法の精度が低い (元論文や自分がやった時よりも低い) ・今回のモデルでは,Attenionの効果が想定以上にあるらしい

6.次に読むべき論文は?

メモ

現実的なシナリオでのフェイクニュース検出 [元の投稿 + RTユーザのリスト]から → [フェイクかどうかの判断 + 疑わしいユーザとそのテキストを生成] Graph-aware Co-attention networks (GCAN)を提案

Intro 問題1:SNSのテキストは短いため、データがスパース 問題2:判断のためにユーザのコメントを豊富に取得する必要 →多くのユーザは単に共有するだけ 問題3:カスケードの経路を取得するのはコストがかかる:Cheng-Te Li, Yu-Jen Lin, and Mi-Yen Yeh. 2018. Fore- casting participants of information diffusion on so- cial networks with its applications. Information Sci- ences, 422:432 – 446. 問題4:説明性がほしい dEFENDなどはそれに対処してるが,長いソーステキストが必要

提案手法:GCAN 特徴 ・ソースツイート + 他のユーザコメントなし + ネットワーク構造無しでフェイクニュースを検出 ・説明可能な根拠を提示:怪しいRTユーザを提示,attentionが払われるテキストを抽出 手法 ユーザの特徴量 + ソーステキストからembedding → CNN + RNN +GNN dual co-attention mechanismの採用:ソース投稿とRT構造の関係や,ソースツイートとユーザの関係といった2つの関係を学習するため

3 Problem Statement 入力:source tweet (s) + user-features (x_j, time) → fake or not (y) + highlight user & words

4 Model 5つの構成要素 ・4.1 ユーザの特徴抽出:11の特徴量 ・4.2 source tweetのencoding:GRUのencoding ・ユーザの伝搬表現 4.3 user propagation representation 最初の投稿からnユーザまでの特徴を学習 ・GRU-badsed ・CNN-based 4.4 Graph-aware Propagation Representation ユーザ同士のcosine距離をweightとしてグラフを作成しGNNで学習 ・4.5 dual co-attention: tweetとユーザの関係 Source-Propagation : 伝搬を行ったRTユーザ (GRU) とソースツイートのCo-Attentionを Source-Interaction: 伝搬を行ったRTユーザ (GNN) とソースツイートのCo-Attentionを ・4.6 prediction module

5 Experiments 比較手法の精度が元論文よりもかなり低い やっぱりEarly Detectionの調査は必要?

5.2 Ablation analysis: Co-attentionによる精度向上効果が高すぎる 5.3 説明性の可視化例 ・breakingとか入っているニュースはたしかにfakeっぽいよね ・Trueを判定する際に拡散初期のユーザから判断している→むしろ、Fakeを判定する際に用いられるものだと思っていた コード:https://github.com/l852888/GCAN