Open IkokObi opened 4 years ago
ランク学習の目的関数の一般的な表現
λ(rank)
が評価指標に対応する関数で,次のような対応関係にある
ポイントは,次の値が式(1)の不偏推定量になっているということ.
式中のr_i(y)=1
はクエリx_i
に対して表示した文書y
がクリックされたことを表し,o_i(y)=1
はクエリx_i
に対して文書y
がユーザからのフィードバックを受けたか否かを表す(例えばページの下方まで見られていない場合o_i(y)=0
となる).
分母に来ている関数Q
は傾向スコアを表しており,これはモデル化や推定する必要がある.ランクに依存した傾向スコアとして,論文中では次の関数が使われている.
最終的な目的関数は次の式(5)
文書の表示順位について,次のようにして上限を与えることが出来る. 具体的に4番目に表示された文書等を当てはめると分かるが,結構上手い変形だと感じた.
上の上限を用いてλ(rank)
関数の中のrank部分を上から押さえ,かつ関数λ(rank)
が単調増加関数であることを用いて(表1の中の関数は全てそうなっている),次の上限を最小化する問題に置き換える.
ざっくり言うと
キーワード
1. 情報
論文リンク
https://dl.acm.org/citation.cfm?id=3331202
著者
Aman Agarwal, Kenta Takatsu, Ivan Zaitsev, Thorsten Joachims
投稿日付
2019/7/21-25 (SIGIR 2019)
2. 先行研究と比べてどこがすごい?
3. 技術や手法のキモはどこ?
4. どうやって有効だと検証した?
5. 議論はある?
6. 次に読むべき論文は?