karakuri-ai / paper-readings

repository to research the machine learning papers
2 stars 1 forks source link

[2019] A General Framework for Counterfactual Learning-to-Rank #41

Open IkokObi opened 4 years ago

IkokObi commented 4 years ago

ざっくり言うと

キーワード

1. 情報

論文リンク

https://dl.acm.org/citation.cfm?id=3331202

著者

Aman Agarwal, Kenta Takatsu, Ivan Zaitsev, Thorsten Joachims

投稿日付

2019/7/21-25 (SIGIR 2019)

2. 先行研究と比べてどこがすごい?

3. 技術や手法のキモはどこ?

4. どうやって有効だと検証した?

5. 議論はある?

6. 次に読むべき論文は?

IkokObi commented 4 years ago

7. 実装の詳細

1. 最適化の目的関数について

  1. ランク学習の目的関数の一般的な表現

    スクリーンショット 2019-08-15 21 39 22
  2. λ(rank)が評価指標に対応する関数で,次のような対応関係にある

    スクリーンショット 2019-08-15 21 40 18
  3. ポイントは,次の値が式(1)の不偏推定量になっているということ. 式中のr_i(y)=1はクエリx_iに対して表示した文書yがクリックされたことを表し,o_i(y)=1はクエリx_iに対して文書yがユーザからのフィードバックを受けたか否かを表す(例えばページの下方まで見られていない場合o_i(y)=0となる).

スクリーンショット 2019-08-15 21 41 29
  1. 分母に来ている関数Qは傾向スコアを表しており,これはモデル化や推定する必要がある.ランクに依存した傾向スコアとして,論文中では次の関数が使われている.

    temp
  2. 最終的な目的関数は次の式(5)

    スクリーンショット 2019-08-15 21 48 47

2. 目的関数の上限について

  1. 文書の表示順位について,次のようにして上限を与えることが出来る. 具体的に4番目に表示された文書等を当てはめると分かるが,結構上手い変形だと感じた.

    スクリーンショット 2019-08-15 21 49 56
  2. 上の上限を用いてλ(rank)関数の中のrank部分を上から押さえ,かつ関数λ(rank)が単調増加関数であることを用いて(表1の中の関数は全てそうなっている),次の上限を最小化する問題に置き換える.

    スクリーンショット 2019-08-15 21 53 16

3. SVMとNNの最適化について

IkokObi commented 4 years ago

8. データセット

スクリーンショット 2019-08-15 22 00 56
IkokObi commented 4 years ago

9. 結果の詳細

スクリーンショット 2019-08-15 22 01 37
IkokObi commented 4 years ago

雑感&メモ