Open yu-ya4 opened 2 years ago
https://arxiv.org/abs/2110.11154
Yongchun Zhu, Zhenwei Tang, Yudan Liu, Fuzhen Zhuang, Ruobing Xie, Xu Zhang, Leyu Lin, Qing He
WSDM 2022
コールドスタート問題は、推薦システムにおける大きな問題の一つである。 この問題に対応する一つの有望な解決策に、クロスドメインレコメンデーション(CDR)がある。 しかし、CDRではソースドメインからターゲットドメインへユーザーの嗜好をどう転移するかが大きな問題になる。
従来の手法の多くはこの転移に共通のブリッジを使用して嗜好をモデル化している。 しかし、直感的には嗜好はユーザごとに異なり、異なるユーザーの嗜好ブリッジは異なると考えられる。
ユーザーごとにパーソナライズされた嗜好ブリッジを使用することで、より精度の高いクロスドメインレコメンデーションの実現。
https://dl.acm.org/doi/abs/10.1145/3488560.3498414
Eコマースにおいてユーザとアイテムのインタラクションのスパースを緩和してCTR予測精度を上げるために、共通のアイテムが使われている推薦側と検索側の両方の行動ログをいい感じに併用したい。推薦と検索では明示的なクエリの有無という大きな違いがあるので、その差異を考慮して推薦と検索の両方におけるユーザとアイテムのインタラクションを統合したグラフを構築する。そして新しいグラフから情報を効率的に抽出できるGNNベースのモデルを提案。提案手法は推薦と検索の両方でベースラインよりも高いパフォーマンスを発揮。
CTR予測の精度を高くしたい。しかし通常のEコマースプラットフォームでは、ユーザーとアイテムのインタラクションがスパースであり(ユーザの多くは非アクティブ、アイテムは盛りだくさん)、ボトルネックになっている。既存研究では推薦 / 検索のどちらか一方に焦点を当てたアプローチが多いが、本研究では推薦と検索の両方のログを学習に使うことでスパース問題を緩和することを目指す。検索と推薦という異なる体験の差異を考慮して、いかに効率的にそれぞれの情報を共有して各経路でのCTR予測の精度を上げていくか、が課題となる。
検索と推薦の最大の差異は、検索には明示的なクエリが存在するが、推薦には明示的なクエリが存在しないこと。これに対して、ユーザとアイテムのインタラクションから構築したグラフのエッジにクエリ情報を付与した、推薦と検索の両方のデータを統合したグラフ(SRJGraph)を作成する。推薦側はクエリがないので「クエリがない」という特殊トークンを用いて作った情報を付与する。
次に、作成したグラフからどのように情報を抽出してCTR予測の精度を上げるか、に着目する。
層ごとに周辺情報を集約して上の層に伝搬させていくのは一般的なGNNと同じだが、検索と推薦の違いを考慮するためにクエリ情報を入れ込んでいる。また集約時に入力サンプルに関連度の高い近傍に注目が集まるよう、入力サンプルからintentionを構築し、これをQueryとしてTransformer layerに投げている。さらに集約時にパスの前方方向を入力に加えて、より広い範囲でノードの周辺情報を集約する。
検索と推薦の両方でベースラインを上回る結果。GNNベースの手法が性能が高い傾向が見られる。明示的にユーザとアイテムの交互作用を考慮しているおかげか。
joint learningしないパターン(推薦、検索それぞれ独立で学習)とjoint learningしたパターンを各ベースラインで比較。JSRは既存の検索・推薦のjoint learning手法。推薦タスクと検索タスクの両方をアイテムの表現を共有させつつ同時に学習させているだけ(ちらっと読んだだけ…)っぽいので、どのベースラインでも適用可能。GNNベースでは、SRJGraph(推薦ログと検索ログの両方で構築したユーザアイテムのグラフ)を使うことでjoint learningとしている。
すべてのベースラインにおいてjoint learningしたほうが精度向上している。joint learningによってデータが増える(インタラクションが増える)ことの寄与がわかる。またjoint learningを適用したベースラインと比べても提案手法が勝っている。これは、提案手法にある追加要素(intention-aware, upstream-aware, query emb)の有効性を示している。
ablation testで個々の要素の寄与を確認。intention , upstream なしだと性能が落ちる。対象となる入力サンプルと関連性の高い近傍により注目が集まるようにすること、パスの前方方向を明確に取り入れることで広く情報を取り入れること、の2点がうまく効いている事がわかる。クエリなしだと少しだが精度は劣化。検索と推薦の差異を考慮することが精度向上につながっていることもわかる。
SIGIR2020の論文
LinkedInで、社内のセールスチームのために推薦システムを構築したという話。
LinkedInのプロダクトを使っているユーザーのニーズは多様で、セールスチームが人の力だけですべて把握して対処するには無理があった。そのため、どのユーザーへの介入の重要性が高いのか、その理由も含めて説明ができるシステムが必要とされていた。
Model Importer, Model Interpreter は入力の形式や用いるアルゴリズムの差異を吸収するような設計になっている。
Narrative Generator内部では特徴量の階層構造を利用している。
特徴量を階層化することで人間に理解しやすく、必要な情報を簡潔に説明することができる。
社内のセールスチームに対してA/Bテストした結果、成績の大幅な向上が実現
自前の記事ですが紹介できれば
H&M Personalized Fashion Recommendations 参加記 (46th/2952)
会社の勉強会でYouTube Musicの画面を投影しながら推薦にちなんだUIを考察したのでその話ができれば(20分程度) 私の私用アカウントの写真を用いるので写真の公開は難しいですが話せれば →次回持越し
Why
推薦・機械学習勉強会は、推薦や機械学習、その周辺技術を通じてサービスを改善することにモチベーションのある人達の集まりです。ニュースやブログから論文まで、気になったものについてお互い共有しましょう!
発信のため、ここは public にしてあります。外部からの参加をご希望の方は松村(https://twitter.com/yu__ya4) まで DM を送るか、Wantedly Visit の募集(https://www.wantedly.com/projects/391912) よりご連絡ください!
What
Wantedly では隔週木曜日に
といった話をする「推薦・機械学習勉強会」を開催しています。 この ISSUE はその会で話すネタを共有するための場所です。
話したいことがある人はここにコメントしましょう! 会の間に話した内容もここにメモしましょう!
prev: #143