Fake news propagates differently from real news even at early stages of spreading

0. 論文

Journal/Conference: EPJ Data Science2020 Title: Fake news propagates differently from real news even at early stages of spreading Authors: Zilong Zhao, Jichang Zhao, Yukie Sano, Orr levy, Hideki Takayasu, Misako Takayasu, Daqing Li, Junjie Wu, Shlomo Havlin URL: https://epjdatascience.springeropen.com/articles/10.1140/epjds/s13688-020-00224-z

1. どんなもの？

フェイクニュースと通常のニュースのSNSでの投稿カスケードの伝搬ネットワークを比較し，Layer ratio，Characteristic distance，Structural heterogeneityという3つの観点で差を発見例1：Layerの割合：AがFake, BがTrue．Trueの方が最初の投稿者からのRTが多い

例2: Structual heterogeneityの例：Fake Newsの方がスターネットワークからかけ離れているものが多い

2. 先行研究と比べてどこがすごい？

伝搬ネットワークのトポロジカル的な特徴に着目し，フェイクとフェイクでないものにおいて有意な差があることを見つけた点

3. 技術や手法のキモはどこ？

4. どうやって有効だと検証した？

投稿カスケードの伝搬ネットワークの特徴に着目し，通常のニュースとフェイクニュースごとにどのような分布で特徴が存在しているかを比較

5. 議論はある？

伝搬ネットワークを取得するのは簡単みたいに書いてるけど大変じゃない？：ユーザのフォロワーとか取得するのが大変

6.次に読むべき論文は？

PLOS ONE2017 Debunking in a world of tribes https://journals.plos.org/plosone/article?id=10.1371/journal.pone.0181821

メモ

・Abstract Weiboとtwitterデータセットを用いて現実的な伝搬メカニズムを理解フェイクニュース拡散の初期段階であっても実際のニュースとは異なる広がりが見られる拡散の初期段階で情報伝播のトポロジカルな特性を特定することで早期発見の特徴提供の可能性を提示

・Introdcuction 感染モデルとしての情報伝播研究の発展：DS modelやSIRモデル時間的特徴 + フェイクニュースの研究例：Smoke Screener or Straight Shooter: Detecting Elite Sybil Attacks in User-Review Social Networks https://arxiv.org/abs/1709.06916 ★debunking投稿に関する分析の研究：ZolloF, BessiA, DelVM et, al. (2017) Debunking in a world of tribes. PLoSONE 12(7) :e0181821

拡散初期にフェイクニュースとリアルニュースの間の伝搬ネットワークを分析伝搬トポロジーの動的な進化の研究をおこヌアフェイクニュースを識別するための初期シグナルを最初のRetweetから5時間後に識別できることを発見

・Results 投稿の中でも最大のカスケードのみに着目

フェイクニュースの方が拡散の層数 (拡散時に間に入るユーザ) が多い

Layer ratio: ノードの累積数を時間の関数として示す：図1, 2参照層の大きさの比率の分布：最初の人の投稿を共有するのか？(first layer)それとも、他の人を介して共有するのか？(2nd layer以降) これの比率が投稿後5時間で有意に異なる実際のニュースから，公式機関やマスメディアによるニュースを除いても伝搬パターンはフェイクのものと異なることが分かる

Characteristics distance: 特徴的距離？拡散するノード間の距離はフェイクの方が長い：後に拡散したものがニュースの浸透に影響を与えている伝搬サイズと特徴距離との相関は小さい

Structural heterogeneity: フェイクニュースと実際のニュースの伝搬ネットワークのHetero-geneityを測定 (Hが小さい：スターネットワークに似ている / 各ユーザのフォロワー数から計測) フェイクニュースではトポロジーの不均一性が顕著 S11：Herfindahl-Hirschman Indexという指標で比較

Classifier: ここで取り上げた3つの指標を用いてSVM (rbf-kernel)で分類すると79.5の精度で分類可能

3 Discussion フェイクニュースの検証には3日要する？：https://phys.org/news/2017-10-fact-checking-fake-news-facebook-.html#jCp (2018.1.23 accessed) テキストベースでなく構造的特徴にのみ焦点を当てる

4 methods Weiboの公式がフェイクニュースを検証：.http://service.account.weibo.com(2018.1.23accessed) フォロワーグラフと投稿データからRTネットワークを作成

東北大震災のデータから(虚偽や間違いといった訂正投稿を省いて)フェイクに関する投稿を取り出す方法：Plos One2015 Rumor Diffusion and Convergence during the3.11 Earthquake: A Twitter Case Study

Supplement informationに図がいっぱいなので、これを見ながらだと良いかも

hkefka385 / paper_reading