nogawanogawa / paper_memo

4 stars 0 forks source link

Sampling-Bias-Corrected Neural Modeling for Large Corpus Item Recommendations #60

Closed nogawanogawa closed 1 year ago

nogawanogawa commented 1 year ago

論文URL

https://research.google/pubs/pub48840/

著者

Xinyang Yi Ji Yang Lichan Hong Derek Zhiyuan Cheng Lukasz Heldt Aditee Ajit Kumthekar Zhe Zhao Li Wei Ed Chi

会議

RecSys 2019

背景

推薦システムは、多くの場合

  1. 検索
    • 少数の関連アイテムに絞る
  2. ランキング
    • 絞り込んだアイテムを再度ランク付けする

の二段階(2stage)のシステムを設計することが多くなっている。

このうち、検索に関しては、従来行列分解系のアプローチが取られていた。 しかしアイテムのコンテンツ的特徴は、先行研究で使用されてはいたが性能は不十分であった。

目的

アプローチ

image

ひとことメモ

Two-Tower modelの大本の論文っぽい

nogawanogawa commented 1 year ago

背景

推薦システムは、多くの場合

  1. 検索
    • 少数の関連アイテムに絞る
  2. ランキング
    • 絞り込んだアイテムを再度ランク付けする

の二段階(2stage)のシステムを設計することが多くなっている。

このうち、検索に関しては、従来行列分解系のアプローチが取られていた。 しかしアイテムのコンテンツ的特徴は、先行研究で使用されてはいたが性能は不十分であった。

nogawanogawa commented 1 year ago

目的

アプローチ

image

nogawanogawa commented 1 year ago

Two-Tower model

ユーザークエリx とアイテムyがあたえられたとき、これらの確率分布はsoftmaxで下記のようにあたえられる。

image

これに対数尤度とrewardを考慮したロスは

image

一般にアイテム数は非常に大きいので、これをバッチに切り分けで考える。 通常ネガティブサンプリングを行うが、ここではバッチの中からネガティブサンプリングを行う。

ポピュレーションバイアス考慮のために、

image

のように出現確率を推定する。

image

バッチ内の正例以外をすべて負例として扱う。

これをロスにすると

image

のようになる。 このようにして学習を行う。

アルゴリズムにすると下記のようなイメージ。 image

nogawanogawa commented 1 year ago

YouTubeのデータへの適用

その他

image

nogawanogawa commented 1 year ago

評価

YouTube Experiments

image

Recallは高くなるらしい

A/Bテストの結果としても下記のように良くなっている。 image