nogawanogawa / paper_memo

4 stars 0 forks source link

A General Framework for Debiasing in CTR Prediction #74

Closed nogawanogawa closed 1 year ago

nogawanogawa commented 1 year ago

論文URL

https://arxiv.org/abs/2112.02767

著者

Wenjie Chu, Shen Li, Chao Chen, Longfei Xu, Hengbin Cui, Kaikui Liu

会議

-(preprint)

背景

CTR予測は推薦システム等でよく使用されるタスクである。 このタスクでは、アイテムが表示される位置に影響を受けるポジションバイアスが発生することが知られている。

ポジションバイアスに対する対処として一般的なのは、ポジションに関する特徴とそれ以外を分離し、それらの積で確率を算出する物となっている。 しかしこの仮定は単純化されすぎている。

目的

既存のCTR予測に使用されている、観測確率 * 嗜好確率の単純化されすぎた仮定を補正する

アプローチ

image

3つのモジュールに分けていて、

これらを組み合わせて使用する。 モデルの構成は基本的には全結合層とソフトマックスで構成され、Combinedでは行列-ベクトル積で結果を計算するようになっている。

また、Constraint Lossを

image image

のように設定。

ひとことメモ

nogawanogawa commented 1 year ago

背景

CTR予測は推薦システム等でよく使用されるタスクである。 このタスクでは、アイテムが表示される位置に影響を受けるポジションバイアスが発生することが知られている。

ポジションバイアスに対する対処として一般的なのは、ポジションに関する特徴とそれ以外を分離し、それらの積で確率を算出する物となっている。

image

第1項が検査確率、第2項が検査されたアイテムがクリックされるかを表しており、第1項は通常posだけに依存する形に変形して使用される。

しかしこの仮定は単純化されすぎている。 特に観測されていないアイテムが検査される場合、大まかに4つのシナリオが考えられる。

image
観測した、関係のあるアイテムをクリック 観測した、無関係のアイテムをクリック
観測していない、関係のあるアイテムをクリック 観測していない、無関係のアイテムをクリック

既存の手法では、このうち上2つしか考慮できていない。

nogawanogawa commented 1 year ago

目的

既存のCTR予測に使用されている、観測確率 * 嗜好確率の単純化されすぎた仮定を補正する

アプローチ

nogawanogawa commented 1 year ago

手法

image

3つのモジュールに分けていて、

これらを組み合わせて使用する。 モデルの構成は基本的には全結合層とソフトマックスで構成され、Combinedでは行列-ベクトル積で結果を計算するようになっている。

また、Constraint Lossを

image image

のように設定している。

nogawanogawa commented 1 year ago

評価

異なる5パターンのクリックに関するシミュレーションデータを使用したAUCを比較した。

image image

結果としては、S1でおおよそ比較対象(PAL)と同程度、S2-S4で性能が優れている。 S5より、文書を考慮した場合AUCは比較対象より優れている。

オンライン

実際にオンラインテストで実験もした。

image

userセグメント毎に既存手法よりどれだけ優れているかを表している。

FCRは大きいほど、YRは小さいほど良い指標。

従来使用してた手法よりA/Bテストの結果もよかったとのこと。