Open zerebom opened 3 years ago
src: https://dl.acm.org/doi/10.1145/3167132.3167276 SAC(Symposium on Applied Computing) 2018の論文。
推薦システムにおける"Serendipity"について過去の複数の先行研究をもとに再定義した。 更にSerendipityを適切に測るために、実際に多数のユーザーにアノテーションしてもらい映画のレビューデータセットを作成。 そのデータセットをもとに、再定義したSerendipityを測る。
推薦システムとは、ユーザーに大量にあるアイテム群から興味のあるアイテムを探すのを助けることを目的に作成されている。 過去の殆どの推薦システムは、推薦したアイテムが実際にユーザーが実際に欲しいものだったかという"Accuracy"を最適化することで学習がなされていた。
しかし近年、推薦システムは単にユーザーの興味を当てるという目的を超えて、 ユーザー自身も存在を知らないアイテムを探してユーザーの興味や知識を広げる役割を担うべきであるとされている。 この考えをもとに新しくAccuracyの代わりに導入された指標がSerendipityである。
過去の論文を複数調べると、Serendipityは以下の3つの要素で構成されていることが多い。
Serendipityのあるアイテムをユーザーに表示することで、
しかし基本的に、Serenipityがなくユーザーが興味あるコンテンツ(既知の関連コンテンツ)よりも ユーザーにとって有用なSerendipityのあるアイテムは非常に少ない。 このようなアイテムが少なすぎると、Serendipityを評価指標として推薦システムを構築することに価値は生まれない。
そこで本論文では以下のようなリサーチクエスチョンを作成し、複数のSerendipityの定義により深い洞察を得ようと試みる。
Q1. 各Serendipityの要素はユーザーの嗜好の広がりや満足度にどのような影響を与えるのか Q2. 各Serendipityの定義はユーザーの嗜好や満足度の向上どのような影響を与えるのか Q3. Serendipityなitemを検出するために有用な特徴量はなにか Q4. 典型的な協調フィルタリングベースのレコメンデーションシステムにおいて、ユーザーが評価した映画の中で、Serendipityな映画はどのくらい珍しいのか?この種のシステムは、ユーザーがこれらの映画を見つけるのに、どの程度役立つのでしょうか?
先行研究からSerendipityの構成要素の定義として以下のようなものがあった。
Novelty
Unexpectedness
本論文ではこれらをもとにSerendipityを細かい要素に再定義し、 どの要素が、ユーザーの体験向上、見聞を広げるのに寄与するかを調べる。
MovieLensを1ヶ月以上利用して過去3ヶ月以内に星3.5以上のレビューを5件以上書いているユーザーに 過去3ヶ月以内に3.5以上とレビューした5件の映画についてそれぞれ8問の質問を1(strongly diagree)~5(strongly agree)の5段階回答してもらった。8問の質問にはそれぞれ、Serendipityの要素が複数紐付いている。
8つの質問
3.5以上のレビューだけを対象とすることで、このデータセットはRelevenceは満たしているものとする。
Serendipityの構成要素 (Strict or Motivational) × (relevance, find, implicit, recommend)
質問内容とその分布
Serendipityな映画の数
cumulative link mixed-effect regression modelを使用した(よくわかってない)
各構成要素の評価への影響
src: https://dl.acm.org/doi/10.1145/3167132.3167276 SAC(Symposium on Applied Computing) 2018の論文。
5行でまとめ
導入
推薦システムにおける"Serendipity"について過去の複数の先行研究をもとに再定義した。 更にSerendipityを適切に測るために、実際に多数のユーザーにアノテーションしてもらい映画のレビューデータセットを作成。 そのデータセットをもとに、再定義したSerendipityを測る。
Introduction
推薦システムとは、ユーザーに大量にあるアイテム群から興味のあるアイテムを探すのを助けることを目的に作成されている。 過去の殆どの推薦システムは、推薦したアイテムが実際にユーザーが実際に欲しいものだったかという"Accuracy"を最適化することで学習がなされていた。
しかし近年、推薦システムは単にユーザーの興味を当てるという目的を超えて、 ユーザー自身も存在を知らないアイテムを探してユーザーの興味や知識を広げる役割を担うべきであるとされている。 この考えをもとに新しくAccuracyの代わりに導入された指標がSerendipityである。
過去の論文を複数調べると、Serendipityは以下の3つの要素で構成されていることが多い。
Serendipityのあるアイテムをユーザーに表示することで、
しかし基本的に、Serenipityがなくユーザーが興味あるコンテンツ(既知の関連コンテンツ)よりも ユーザーにとって有用なSerendipityのあるアイテムは非常に少ない。 このようなアイテムが少なすぎると、Serendipityを評価指標として推薦システムを構築することに価値は生まれない。
そこで本論文では以下のようなリサーチクエスチョンを作成し、複数のSerendipityの定義により深い洞察を得ようと試みる。
Q1. 各Serendipityの要素はユーザーの嗜好の広がりや満足度にどのような影響を与えるのか Q2. 各Serendipityの定義はユーザーの嗜好や満足度の向上どのような影響を与えるのか Q3. Serendipityなitemを検出するために有用な特徴量はなにか Q4. 典型的な協調フィルタリングベースのレコメンデーションシステムにおいて、ユーザーが評価した映画の中で、Serendipityな映画はどのくらい珍しいのか?この種のシステムは、ユーザーがこれらの映画を見つけるのに、どの程度役立つのでしょうか?
先行研究におけるのSerendipityの定義の例
先行研究からSerendipityの構成要素の定義として以下のようなものがあった。
Novelty
Unexpectedness
本論文ではこれらをもとにSerendipityを細かい要素に再定義し、 どの要素が、ユーザーの体験向上、見聞を広げるのに寄与するかを調べる。
データセットの作成
MovieLensを1ヶ月以上利用して過去3ヶ月以内に星3.5以上のレビューを5件以上書いているユーザーに 過去3ヶ月以内に3.5以上とレビューした5件の映画についてそれぞれ8問の質問を1(strongly diagree)~5(strongly agree)の5段階回答してもらった。8問の質問にはそれぞれ、Serendipityの要素が複数紐付いている。
8つの質問
3.5以上のレビューだけを対象とすることで、このデータセットはRelevenceは満たしているものとする。
Serendipityの構成要素 (Strict or Motivational) × (relevance, find, implicit, recommend)
質問内容とその分布
Serendipityな映画の数
分析手法
cumulative link mixed-effect regression modelを使用した(よくわかってない)
Serendipityの各構成要素の評価への影響
各構成要素の評価への影響
wip
2種の構成要素をもつ場合の評価への影響 ![image](https://user-images.githubusercontent.com/38466611/114796385-c5f4aa80-9dcb-11eb-93eb-f02402643c6e.png)異なるSerendipityの定義と評価への影響
Serendipityな映画を見つけるのに必要な特徴量