nogawanogawa / paper_memo

4 stars 0 forks source link

Professional Network Matters: Connections Empower Person-Job Fit #112

Closed nogawanogawa closed 2 months ago

nogawanogawa commented 2 months ago

論文URL

https://arxiv.org/pdf/2401.00010

著者

Hao Chen, Lun Du, Yuxuan Lu, Qiang Fu, Xu Chen, Shi Han, Yanbin Kang, Guangming Lu, Zi Li

会議

WSDM 2024

背景

LinkedInでは、9億人以上の会員が登録し、2023年の第1四半期までに毎秒90件の求人が掲載されている。これらに対して、Person Job Fit(ユーザーと求人を紐づけ)は採用・求職における重要なテーマになる。

これまで、過去の応募状況やコンテンツ情報を基にPerson Job Fitを推定することは行われていたが、プロフェッショナル・ネットワークと呼ばれるソーシャルなつながりは利用されてこなかった

(とある調査によれば80%のユーザーがプロフェッショナル・ネットワークを用いて仕事をみつけ、70%がコネクションを通じて直接仕事の機会を得ているらしい)

目的

アプローチ

image

ひとことメモ

nogawanogawa commented 2 months ago

背景

LinkedInでは、9億人以上の会員が登録し、2023年の第1四半期までに毎秒90件の求人が掲載されている。これらに対して、Person Job Fit(ユーザーと求人を紐づけ)は採用・求職における重要なテーマになる。

これまで、過去の応募状況やコンテンツ情報を基にPerson Job Fitを推定することは行われていたが、プロフェッショナル・ネットワークと呼ばれるソーシャルなつながりは利用されてこなかった

(とある調査によれば80%のユーザーがプロフェッショナル・ネットワークを用いて仕事をみつけ、70%がコネクションを通じて直接仕事の機会を得ているらしい)

nogawanogawa commented 2 months ago

目的

アプローチ

nogawanogawa commented 2 months ago

WHIN

想定しているグラフデータはこんな感じで、5種類のエンティティと9種類のリレーションで構成されている

image

加えて、2つのメタパス(特殊なパス)が決められていて、

が定められている

nogawanogawa commented 2 months ago

事前学習

事前学習にはリンクレベルの事前学習タスクを解く。 WHINから部分グラフをサンプリングし、ミニバッチを作成する。

source nodeを決め、そこからk hop先までのエンティティを取得、その後直接 + メタパスを含めたサブグラフを構成している。

image

更に、期待されたrelationにないエンティティを負例としてサンプリングする。 この中から、2つのエンティティ間のリンクの存在を予測するタスクをencoder-decoder モデルで学習する

embeddingの初期値は各エンティティのテキストコンテンツに関して、bertによってembeddingを取得したもの(平均)としている

nogawanogawa commented 2 months ago

モデル・学習

ネットワークにはノイズも多い。 それに対応するため、学習にはマルチヘッドアテンションを利用する。

image

J0とm0の間のfitを予測するために、relationがあるユーザー1, 2,も取得し、更に保持するスキル0〜2も取得する。 各ユーザーの学習済み + テキストembeddingに対して、スキルを基にしたattentionを適用させる。 これを繰り返し、得られたユーザー0のembeddingの平均をMLPの入力に使用する。

nogawanogawa commented 2 months ago

評価

image

nogawanogawa commented 2 months ago

CSAGNNを使用する旨味

image

ちゃんとスキルも分けられているっぽい

image