wantedly / machine-learning-round-table

Gather around the table, and have a discussion to catch up the latest trend of machine learning 🤖
https://www.wantedly.com/projects/391912
305 stars 2 forks source link

[2022/09/29]Machine Learning 輪講 #162

Open hakubishin3 opened 2 years ago

hakubishin3 commented 2 years ago

Why

Machine Learning 輪講は最新の技術や論文を追うことで、エンジニアが「技術で解決できること」のレベルをあげていくことを目的にした会です。

prev. https://github.com/wantedly/machine-learning-round-table/issues/161

What

話したいことがある人はここにコメントしましょう! 面白いものを見つけた時点でとりあえず話すという宣言だけでもしましょう!

hakubishin3 commented 2 years ago

RankFlow: Joint Optimization of Multi-Stage Cascade Ranking Systems as Flows

Qin, Jiarui and Zhu, Jiachen and Chen, Bo and Liu, Zhirong and Liu, Weiwen and Tang, Ruiming and Zhang, Rui and Yu, Yong and Zhang, Weinan

https://dl.acm.org/doi/abs/10.1145/3477495.3532050

マルチステージ間の相互作用を考慮したマルチステージ推薦システムのフレームワークRankFlowを提案

課題

既存のマルチステージの推薦システムは各ランキングステージを独立で学習して推論を行っている。

推論時は前段のステージの結果を後段の入力に渡す形式を取っているため、各ステージにおいて学習データ分布と推論データ分布が大きくズレてしまう課題がある(セレクションバイアス)。また後段ほど影響が積み重なり問題が大きくなりやすい。

また学習時に独立したものとして扱っている各ステージは実際には相互作用しているので、相互作用を考慮した学習方法を利用することで、独立で学習するやり方よりも効率良く性能の高いシステムを作ることが期待できる。

アプローチ

マルチステージの推薦システムのフレームワークとして RankFlow を提案。予め独立して学習された各ステージで推論を行いデータセットを生成しておき、前段で生成されたデータセットを利用して後段のステージが2種類のタスク(self learning, tutor learning)を解くことによって、学習データと推論データの分布を一致させた推論精度の担保(バイアスの問題の緩和)と、複雑な後段モデルを教師とした前段モデルの精度向上(各ステージの相互作用の利用)を実現させる。

self learning は前段ステージで生成されたデータセットを使って学習するタスク。

tutor learning は後段モデルを教師として前段モデルを訓練するタスク。後段モデルは複雑で性能の高いモデルが採用されるので、前段モデルの良い教師となる。

スクリーンショット 2022-09-27 0 09 18

実験結果

Performance

複数のデータセットでベースラインに比べて性能向上していることを確認。

スクリーンショット 2022-09-27 0 59 20

Ablation Study

構成要素を抜くと精度が落ちるのでどれも基本的に重要。特に self learning は必要性が高い。

スクリーンショット 2022-09-27 0 59 52

プレランキングを複雑なモデルに置き換えた場合のプレランキングの性能向上度合い(ベースラインは独立に学習したプレランキング)。Rank as Pre-rank はランキングモデルをプレランキングに採用したもの。RankFlowはオリジナルのプレランキングをRankFlowで学習させたもの。RankFlowは複雑なモデルをプレランキングに導入しなくても性能向上するので、推論速度の観点でもお得。

スクリーンショット 2022-09-27 1 01 11

Hyperparameters Study

ステージの数を2,4で実験。異なるステージ数でも安定して性能向上していることを確認。

スクリーンショット 2022-09-27 1 09 22

Hayashi-Yudai commented 2 years ago

Multi-behavior Recommendation with Graph Convolutional Networks

SIGIR '20 で発表されたグラフベースの推薦手法。ユーザーの異なる行動(impやclickなど)をうまく活用して推薦をすることが可能であり、コールドスタート問題にも対処できる。

現状の課題と解決方法の概要

CFに代表されるような従来の推薦モデルでは、

という問題があった。この論文では、GNNを使ってユーザーごとに行動が表す嗜好性の強さも学習し、さらにユーザーが連続してインタラクションしたアイテムの情報を使うことによってユーザー行動の流れをモデルに取り込んだ。後者に関してはアイテム間の情報をモデルに取り込むことになるのでコールドスタート問題に対して威力を発揮する。

モデル

image

ユーザー・アイテム間の関係を学習する部分と、アイテム間の関係を学習する部分からなる。両者ともに高次のインタラクションまで取り込むという構造をしている(ユーザーが直接インタラクションしたアイテム、ユーザーが直接インタラクションしたアイテムにインタラクションした他のユーザーがインタラクションしたアイテム、、、)

結果

image

Tmallというデータセットではベースラインと比べて平均25 %の精度向上を示している。

image

コールドスタートの状況にあるユーザーに対しての性能も先行研究と比べて優れている。

zerebom commented 2 years ago

Towards Psychologically-Grounded Dynamic Preference Models

心理学に基づき、ユーザの動的な嗜好変化をモデリングする方法を提案した論文。単純接触効果、オペランド条件づけ、快楽順応を簡単な式に落とし込み、ユーザの嗜好の遷移をシミュレーションしている。

アイテム, 嗜好ベクトルをそれぞれ独立正規分布からベクトルを作り、cos_simでscoreを作り、学習していく実験を考案。

定式化

結果