wantedly / machine-learning-round-table

Gather around the table, and have a discussion to catch up the latest trend of machine learning 🤖
https://www.wantedly.com/projects/391912
297 stars 2 forks source link

[2022/06/02]推薦・機械学習勉強会 #145

Open yu-ya4 opened 2 years ago

yu-ya4 commented 2 years ago

Why

推薦・機械学習勉強会は、推薦や機械学習、その周辺技術を通じてサービスを改善することにモチベーションのある人達の集まりです。ニュースやブログから論文まで、気になったものについてお互い共有しましょう!

発信のため、ここは public にしてあります。外部からの参加をご希望の方は松村(https://twitter.com/yu__ya4) まで DM を送るか、Wantedly Visit の募集(https://www.wantedly.com/projects/391912) よりご連絡ください!

What

Wantedly では隔週木曜日に

といった話をする「推薦・機械学習勉強会」を開催しています。 この ISSUE はその会で話すネタを共有するための場所です。

話したいことがある人はここにコメントしましょう! 会の間に話した内容もここにメモしましょう!

prev: #143

nogawanogawa commented 2 years ago

Personalized Transfer of User Preferences for Cross-domain Recommendation

論文URL

https://arxiv.org/abs/2110.11154

著者

Yongchun Zhu, Zhenwei Tang, Yudan Liu, Fuzhen Zhuang, Ruobing Xie, Xu Zhang, Leyu Lin, Qing He

会議

WSDM 2022

背景

コールドスタート問題は、推薦システムにおける大きな問題の一つである。 この問題に対応する一つの有望な解決策に、クロスドメインレコメンデーション(CDR)がある。 しかし、CDRではソースドメインからターゲットドメインへユーザーの嗜好をどう転移するかが大きな問題になる。

従来の手法の多くはこの転移に共通のブリッジを使用して嗜好をモデル化している。 しかし、直感的には嗜好はユーザごとに異なり、異なるユーザーの嗜好ブリッジは異なると考えられる。

image

目的

ユーザーごとにパーソナライズされた嗜好ブリッジを使用することで、より精度の高いクロスドメインレコメンデーションの実現。

アプローチ

image

image

memo

https://github.com/nogawanogawa/paper_memo/issues/49

hakubishin3 commented 2 years ago

Joint Learning of E-commerce Search and Recommendation with a Unified Graph Neural Network

https://dl.acm.org/doi/abs/10.1145/3488560.3498414

サマリー

Eコマースにおいてユーザとアイテムのインタラクションのスパースを緩和してCTR予測精度を上げるために、共通のアイテムが使われている推薦側と検索側の両方の行動ログをいい感じに併用したい。推薦と検索では明示的なクエリの有無という大きな違いがあるので、その差異を考慮して推薦と検索の両方におけるユーザとアイテムのインタラクションを統合したグラフを構築する。そして新しいグラフから情報を効率的に抽出できるGNNベースのモデルを提案。提案手法は推薦と検索の両方でベースラインよりも高いパフォーマンスを発揮。

モチベーション

CTR予測の精度を高くしたい。しかし通常のEコマースプラットフォームでは、ユーザーとアイテムのインタラクションがスパースであり(ユーザの多くは非アクティブ、アイテムは盛りだくさん)、ボトルネックになっている。既存研究では推薦 / 検索のどちらか一方に焦点を当てたアプローチが多いが、本研究では推薦と検索の両方のログを学習に使うことでスパース問題を緩和することを目指す。検索と推薦という異なる体験の差異を考慮して、いかに効率的にそれぞれの情報を共有して各経路でのCTR予測の精度を上げていくか、が課題となる。

提案手法

スクリーンショット 2022-06-02 1 22 32

検索と推薦の最大の差異は、検索には明示的なクエリが存在するが、推薦には明示的なクエリが存在しないこと。これに対して、ユーザとアイテムのインタラクションから構築したグラフのエッジにクエリ情報を付与した、推薦と検索の両方のデータを統合したグラフ(SRJGraph)を作成する。推薦側はクエリがないので「クエリがない」という特殊トークンを用いて作った情報を付与する。

スクリーンショット 2022-06-02 1 22 47

次に、作成したグラフからどのように情報を抽出してCTR予測の精度を上げるか、に着目する。

層ごとに周辺情報を集約して上の層に伝搬させていくのは一般的なGNNと同じだが、検索と推薦の違いを考慮するためにクエリ情報を入れ込んでいる。また集約時に入力サンプルに関連度の高い近傍に注目が集まるよう、入力サンプルからintentionを構築し、これをQueryとしてTransformer layerに投げている。さらに集約時にパスの前方方向を入力に加えて、より広い範囲でノードの周辺情報を集約する。

実験内容

RQ1: 既存のCTR予測モデルと比べてSRJGraphはどのぐらい性能向上しているのか

スクリーンショット 2022-06-02 1 22 14

検索と推薦の両方でベースラインを上回る結果。GNNベースの手法が性能が高い傾向が見られる。明示的にユーザとアイテムの交互作用を考慮しているおかげか。

RQ2: 推薦と検索でjoint learningすることはどのぐらい性能向上に寄与するのか

スクリーンショット 2022-06-02 1 20 37

joint learningしないパターン(推薦、検索それぞれ独立で学習)とjoint learningしたパターンを各ベースラインで比較。JSRは既存の検索・推薦のjoint learning手法。推薦タスクと検索タスクの両方をアイテムの表現を共有させつつ同時に学習させているだけ(ちらっと読んだだけ…)っぽいので、どのベースラインでも適用可能。GNNベースでは、SRJGraph(推薦ログと検索ログの両方で構築したユーザアイテムのグラフ)を使うことでjoint learningとしている。

すべてのベースラインにおいてjoint learningしたほうが精度向上している。joint learningによってデータが増える(インタラクションが増える)ことの寄与がわかる。またjoint learningを適用したベースラインと比べても提案手法が勝っている。これは、提案手法にある追加要素(intention-aware, upstream-aware, query emb)の有効性を示している。

RQ3: intention-aware aggregation と upstream-aware aggregation がどのぐらい性能向上に寄与するのか

スクリーンショット 2022-06-02 1 20 58

ablation testで個々の要素の寄与を確認。intention , upstream なしだと性能が落ちる。対象となる入力サンプルと関連性の高い近傍により注目が集まるようにすること、パスの前方方向を明確に取り入れることで広く情報を取り入れること、の2点がうまく効いている事がわかる。クエリなしだと少しだが精度は劣化。検索と推薦の差異を考慮することが精度向上につながっていることもわかる。

zerebom commented 2 years ago

DeNA・MoT AI技術共有会発表資料 H&Mコンペの振り返り

LightGCN: Simplifying and Powering Graph Convolution Network for Recommendation

SIGIR2020の論文

概要

Method

Light Graph Convolution

実験結果

Hayashi-Yudai commented 2 years ago

The journey to build an explainable AI-driven recommendation system to help scale sales efficiency across LinkedIn

LinkedInで、社内のセールスチームのために推薦システムを構築したという話。

LinkedInのプロダクトを使っているユーザーのニーズは多様で、セールスチームが人の力だけですべて把握して対処するには無理があった。そのため、どのユーザーへの介入の重要性が高いのか、その理由も含めて説明ができるシステムが必要とされていた。

システムの構成

image

CrystalCandle

Model Importer, Model Interpreter は入力の形式や用いるアルゴリズムの差異を吸収するような設計になっている。

Narrative Generator内部では特徴量の階層構造を利用している。

image

特徴量を階層化することで人間に理解しやすく、必要な情報を簡潔に説明することができる。

評価

社内のセールスチームに対してA/Bテストした結果、成績の大幅な向上が実現

image
nadare881 commented 2 years ago

H&M Personalized Fashion Recommendations 参加記 (46th/2952)

自前の記事ですが紹介できれば H M 46th solution overview drawio H&M Personalized Fashion Recommendations 参加記 (46th/2952)

YouTube MusicのUIを見る

会社の勉強会でYouTube Musicの画面を投影しながら推薦にちなんだUIを考察したのでその話ができれば(20分程度) 私の私用アカウントの写真を用いるので写真の公開は難しいですが話せれば →次回持越し