masatakashiwagi / paper

A repository that summarizes the papers you read.
1 stars 0 forks source link

Innovating Faster on Personalization Algorithms at Netflix Using Interleaving #38

Open masatakashiwagi opened 2 years ago

masatakashiwagi commented 2 years ago

Innovating Faster on Personalization Algorithms at Netflix Using Interleaving

どのようなもの?

議論はあるか?

次に読むべき記事は?

備考

masatakashiwagi commented 2 years ago

For instance, the Top Picks row on the homepage makes recommendations based on a personalized ranking of videos, and the Trending Now row also incorporates recent popularity trends.

Netflixも実践しているように,トップピック(ピックアップ)では,パーソナライズしたものをレコメンドエンジンで提供し,トレンドでは,最近の人気を反映させる(比較的新しいコンテンツを対象にランキングを作るのが良さそう)

masatakashiwagi commented 2 years ago

Netflixでの開発プロセス:

  1. 新しいランキングアルゴリズムを作成し,そのパフォーマンスをオフラインで評価する
  2. A/Bテストを活用して,会員の満足度を最大化するというビジネス上の目的に沿ったコア評価指標のオンライン測定
    • 評価指標: 月々の契約維持率や会員のストリーミング時間などがある
    • 最適化されていくと,評価指標の勝敗を決める上で,大きなサンプルサイズと長い実験期間が必要

2段階のオンライン実験プロセスの考案:

masatakashiwagi commented 2 years ago

image

masatakashiwagi commented 2 years ago

Using a repeated measures design to determine preferences

masatakashiwagi commented 2 years ago

A/BテストとInterleavingの違い

image

masatakashiwagi commented 2 years ago

ポジションバイアスの問題

image

masatakashiwagi commented 2 years ago

Interleavingの感度を従来のA/Bテストと比較する

image

masatakashiwagi commented 2 years ago

interleavingメトリクスとA/Bメトリクスとの相関関係

image

masatakashiwagi commented 2 years ago

Conclusion

masatakashiwagi commented 2 years ago

コード

masatakashiwagi commented 2 years ago

NOKIAの事例

img3

img4

G-test

img5

結果

img6

This idea was supported by the findings of Carvalho and Goldstone (2014a) who found interleaving to be helpful if exemplars were similar and therefore easily confused, but blocking to be preferable if items were more distinct.

Putting category learning in order: Category structure and temporal arrangement affect the benefit of interleaved over blocked study, Memory & Cognition, 42, 481–495.