zerebom / paper-books

@zerebom が読んだ技術書、論文をまとめています。推薦システム系が多いです。
https://github.com/zerebom/paper-books/issues
2 stars 0 forks source link

[WIP]Investigating serendipity in recommender systems based on real user feedback #47

Open zerebom opened 3 years ago

zerebom commented 3 years ago

src: https://dl.acm.org/doi/10.1145/3167132.3167276 SAC(Symposium on Applied Computing) 2018の論文。

5行でまとめ

導入

推薦システムにおける"Serendipity"について過去の複数の先行研究をもとに再定義した。 更にSerendipityを適切に測るために、実際に多数のユーザーにアノテーションしてもらい映画のレビューデータセットを作成。 そのデータセットをもとに、再定義したSerendipityを測る。

Introduction

推薦システムとは、ユーザーに大量にあるアイテム群から興味のあるアイテムを探すのを助けることを目的に作成されている。 過去の殆どの推薦システムは、推薦したアイテムが実際にユーザーが実際に欲しいものだったかという"Accuracy"を最適化することで学習がなされていた。

しかし近年、推薦システムは単にユーザーの興味を当てるという目的を超えて、 ユーザー自身も存在を知らないアイテムを探してユーザーの興味や知識を広げる役割を担うべきであるとされている。 この考えをもとに新しくAccuracyの代わりに導入された指標がSerendipityである。

過去の論文を複数調べると、Serendipityは以下の3つの要素で構成されていることが多い。

  1. relevance(関連性)
  2. novelty(目新しさ)
  3. unexpectedness(意外性)

Serendipityのあるアイテムをユーザーに表示することで、

  1. ユーザーの満足度を向上させる
  2. ユーザーの好みを広げる ことができるとされている。

しかし基本的に、Serenipityがなくユーザーが興味あるコンテンツ(既知の関連コンテンツ)よりも ユーザーにとって有用なSerendipityのあるアイテムは非常に少ない。 このようなアイテムが少なすぎると、Serendipityを評価指標として推薦システムを構築することに価値は生まれない。

そこで本論文では以下のようなリサーチクエスチョンを作成し、複数のSerendipityの定義により深い洞察を得ようと試みる。

Q1. 各Serendipityの要素はユーザーの嗜好の広がりや満足度にどのような影響を与えるのか Q2. 各Serendipityの定義はユーザーの嗜好や満足度の向上どのような影響を与えるのか Q3. Serendipityなitemを検出するために有用な特徴量はなにか Q4. 典型的な協調フィルタリングベースのレコメンデーションシステムにおいて、ユーザーが評価した映画の中で、Serendipityな映画はどのくらい珍しいのか?この種のシステムは、ユーザーがこれらの映画を見つけるのに、どの程度役立つのでしょうか?

先行研究におけるのSerendipityの定義の例

先行研究からSerendipityの構成要素の定義として以下のようなものがあった。

Novelty

Unexpectedness

本論文ではこれらをもとにSerendipityを細かい要素に再定義し、 どの要素が、ユーザーの体験向上、見聞を広げるのに寄与するかを調べる。

データセットの作成

MovieLensを1ヶ月以上利用して過去3ヶ月以内に星3.5以上のレビューを5件以上書いているユーザーに 過去3ヶ月以内に3.5以上とレビューした5件の映画についてそれぞれ8問の質問を1(strongly diagree)~5(strongly agree)の5段階回答してもらった。8問の質問にはそれぞれ、Serendipityの要素が複数紐付いている。

8つの質問

3.5以上のレビューだけを対象とすることで、このデータセットはRelevenceは満たしているものとする。

Serendipityの構成要素 (Strict or Motivational) × (relevance, find, implicit, recommend)

質問内容とその分布 image

image

Serendipityな映画の数 image

分析手法

cumulative link mixed-effect regression modelを使用した(よくわかってない) image

Serendipityの各構成要素の評価への影響

各構成要素の評価への影響 image

wip 2種の構成要素をもつ場合の評価への影響 ![image](https://user-images.githubusercontent.com/38466611/114796385-c5f4aa80-9dcb-11eb-93eb-f02402643c6e.png)

異なるSerendipityの定義と評価への影響

image

Serendipityな映画を見つけるのに必要な特徴量

image

image