Closed nogawanogawa closed 8 months ago
LinkedInには世界中の社会人・学生・企業・学校などがつながるネットワークを持っている。 これらのグラフは最大1000億のノードと数千億のエッジにもなります。
インタラクションには、求人応募、投稿に対するエンゲージメントなどが含まれます。
こうした巨大なグラフデータを用いて開発するには課題がある。
大規模なグラフニューラルネットワークの実アプリケーション活用
エッジは大きく3種類
グラフエンジン
LiGNNは補助的な情報に基づいて人工的なエッジを追加することでグラフの高密度化を実装している。
エッジの少ないノードについて、エッジの多いノードについて近傍N件について人工のエッジを生成する。こうすることでコールドスタートにも対応する。
グラフの学習の際に、サンプリング・HDFSからのデータ取得が必要になり、ネットワークの負荷が増大する。そのための工夫をした。(そもそもそこそこの確率で学習が失敗していた?)
投稿に対するエンゲージメントのリンク予測タスク。
オフラインで9.6%の改善、オンラインでも0.5%の改善らしい
DAUが0.2%増加したらしい。
あんまりちゃんと書いてないけど、良くなったらしい
これもあんまり書いてないけど良くなったらしい
論文URL
https://arxiv.org/abs/2402.11139
著者
Fedor Borisyuk, Shihai He, Yunbo Ouyang, Morteza Ramezani, Peng Du, Xiaochen Hou, Chengming Jiang, Nitin Pasumarthy, Priya Bannur, Birjodh Tiwana, Ping Liu, Siddharth Dangi, Daqi Sun, Zhoutao Pei, Xiao Shi, Sirou Zhu, Qianqi Shen, Kuang-Hsuan Lee, David Stein, Baolei Li, Haichao Wei, Amol Ghoting, Souvik Ghosh
会議
KDD 2024 (予定)
背景
LinkedInには世界中の社会人・学生・企業・学校などがつながるネットワークを持っている。 これらのグラフは最大1000億のノードと数千億のエッジにもなります。
インタラクションには、求人応募、投稿に対するエンゲージメントなどが含まれます。
こうした巨大なグラフデータを用いて開発するには課題がある。
目的
大規模なグラフニューラルネットワークの実アプリケーション活用
アプローチ
ひとことメモ