Open osuossu8 opened 3 years ago
eBay マーケットプレイス
16億以上の商品と1億8300万人以上のユーザー - ユーザ-アイテム行列の規模と極端な疎性 - 毎日何百万もの新しいアイテムが出品されているため,コールドスタート問題 - ライブリストの半分以上は単品であり, つまり,最大で1人が購入できる - 購入された後は購入されたアイテムはサイトから削除され、ユーザーはアクセスできなくなる - クリックや購入などの暗黙のユーザーフィードバック信号は非常に希薄
ユーザープロファイル
Model
アイテムのエンコード
ユーザーのエンコード
ユーザーのアクション --> "マルチモーダル"
アイテムベースのイベントとクエリベースのイベントの代表として、アイテム閲覧と検索クエリのユーザーアクションから始めることにした
アイテムビュー/クリックは、電子商取引市場における暗黙のユーザーフィードバックの最も一般的な形態であり、大量のトレーニングデータを生成
アイテムベースのイベント𝑧𝑖については、まず対応するアイテム𝑠𝑧𝑖を、3.1節で述べたように、対応する埋め込みv𝑧𝑖にマッピングし、そのイベントタイプを表す4次元ベクトルe𝑧𝑖と連結
各検索クエリを「擬似アイテム」としてモデル化し、実際のクエリテキストをアイテムタイトルの代わりにし、「支配的な」クエリカテゴリ(別のモデルを用いて予測)をアイテムカテゴリの代わりにし、アスペクトを空にする。
イベントタイプのエンベッディングは、アイテムベースのエンベッディングに連結
この検索クエリシグナルをモデルに加えることで、オフラインでの検証指標であるRecall@20が約4%向上
各ユーザイベント𝑧𝑖について、それに対応するベクトル表現𝐸(𝑧𝑖)を次のように表します。𝐸(𝑧𝑖) = concat(v𝑧𝑖 , e𝑧𝑖 )
連続的なBag-of-Events表現
リカレント表現 (GRU)
このリカレントユーザー表現をモデルに用いることで、オフラインのRecall@20指標で約5%の向上が見られた
データセット
ネガティブ・サンプリング
( 1 )
( 2 )
評価指標
モデルの安定性と予測のロバスト性
予測
アーキテクチャ
論文リンク
見つけた方法
どんなもの?
(先行研究と比べて) どこがすごい?
eBayのトラフィックから収集したデータセットを用いたオフライン評価において
Recall@k指標をRecently-Viewed-Item (RVI)手法よりも向上させることができた
初期のA/Bテストの結果、現在運用中のパーソナライズド・レコメンデーション・モジュールと比較して、提案手法はサーフェイス・レートを約6%向上させ、リスティング・ページ・インプレッションの90%に対してレコメンデーションを生成することができた
従来の協調フィルタリングや行列分解法[1]は,eBayのユーザ-アイテム行列の規模と極端な疎性を考慮すると,不十分な結果となる
技術や手法のキモはどこ?
(i) コールドスタート問題を解決するために、コンテンツベースのアイテムエンベッディングを生成
(ii) アイテムの閲覧や検索クエリなどの様々なオンサイトイベントから、マルチモーダルなユーザーエンベッディングを生成する
(ii) アイテムの閲覧や検索クエリなどの様々なイベントからマルチモーダルなユーザエンベッディングを生成
(iii) 学習データを選択的に削除し、生成量を増加させる。 モデルのロバスト性の向上
(iv) クラスタベースのKNNアルゴリズムを利用して、推奨アイテムの多様性を高める
(v) このモデルとエンドツーエンドの推奨システムをeBayの大規模な工業生産現場に展開する
議論はある?