hkefka385 / paper_reading

3 stars 1 forks source link

Hierarchical Propagation Networks for Fake News Detection: Investigation and Exploitation #8

Open hkefka385 opened 4 years ago

hkefka385 commented 4 years ago

0. 論文

Journal/Conference: ICWSM 2020 Title: Hierarchical Propagation Networks for Fake News Detection: Investigation and Exploitation Authors: Kai Shu, Deepak Mahudeswaran, Suhang Wang, Huan Liu URL: https://arxiv.org/abs/1903.09196

1. どんなもの?

Hierarchical Propagation Networks (HPN),つまり投稿の伝搬ネットワークやリプライネットワークがどれほどフェイクニュース検出において有用なのか検証

2. 先行研究と比べてどこがすごい?

今まで漠然と有用だと分かっていたHPNに対して,統計量や検出の実験においてより明確にどういった点が有用だと明らかにした点

3. 技術や手法のキモはどこ?

4. どうやって有効だと検証した?

・HPNなどの特徴量が有用であるかどうかを検証するために,様々なアルゴリズムで検出実験 ・RFとGini係数を用いて,有用な特徴について検証

5. 議論はある?

HPNの特徴で有用なものであるとはっきり分かったものは,直感に反しないものであったことが大きい貢献 もう,再現性が担保出来ないpolitifcatとgossipcopのデータセット使わないでください

6.次に読むべき論文は?

メモ

内容ではなく,階層伝搬ネットワークを用いてフェイクニュース検出 階層的伝搬ネットワークが特徴の有用性について検証する

Intro マクロレベルとミクロレベルの伝搬ネットワーク ・マクロレベルでの特徴 (全体的):botの多さ,多くのユーザを経由 →これが本当に有用なのかといった研究があまり行われていない ・ミクロレベルでの特徴 :ユーザの会話やテキスト的特徴 RQ1:フェイクとリアルの階層的伝搬ネットワークや言語的特徴の違いは? RQ2:これらの特徴でフェイクニュースを検知できる?

2 Propagation networkの構築 ・macro:RT 作成ルール:Goel, S.; Anderson, A.; Hofman, J.; and Watts, D. J. 2015. The structural virality of online diffusion. Management Sci- ence 62(1):180–196. ・micro:リプライ

3 Analyze t検定などで有意な差異を発見する

Macro 役立つことは知られてるが、詳細がわからない
木の深さやノード数の平均などの統計量を記載 ・structure フェイクの特徴として分かること 木が深くなる 最大ノードを持つユーザの位置が深い 影響力が長引く

・Temporal フェイクの特徴として分かること フェイクの方が短命 フェイクニュースの方が影響力のあるユーザにリーチしやすい フェイクの方がより短い時間に連投される

Micro ・structure フェイクの特徴として分かること 木が深くなる コメント数が多い

・Temporal フェイクの特徴として分かること コメントするのに時間が掛かっている (議論の多い話題のため)

・Linguistic VADERなどを用いて感情分析:フェイクの方がネガティブ

4 分析してきた特徴 (hierarchical propagation network features: HPNF)を一つのベクトルとして HPNFとLIWCやRSTといった言語的メトリックやプロパゲーション情報をconcatenateして,比較のための特徴を作成 →こういった実験を通してHPNFの有用性は分かる 特徴のロバスト性を検証するために他のアルゴリズムを通して精度検証

Feature Importance Analysis:重要 マクロとミクロどちらが有用とはいえない:データセットによって精度が異なる ・マクロネットワークではRTされたカスケードの割合やニュースの寿命(life span)などが有用であった ・最初のツイートと最後のツイートの時間差も有用 →データセットによってまちまちなので,一貫していえないが直感に反しない結果:life spanやコメントの量などが有用

6 Conclusion 検出の実験によって有効だと分かったこと これらの特徴はフェイクニュースの検出に大きく貢献できること、 これらの特徴は異なる学習アルゴリズムに対して全体的にロバストであること、 時間的特徴は言語的特徴や構造的特徴よりも識別力が高く、マクロレベルとミクロレベルの特徴は相補的である