Open hakubishin3 opened 6 months ago
PCA(左)とUMAP(右)のMNISTデータの次元圧縮の比較
k-means(左)とHDBSCAN(右)のMNISTデータの次元圧縮の比較
DEIM2023,著者:飯塚洸二郎, 久保 光証, 森田 一 (Gunosy)
人気バイアス評価指標
人気バイアスを考慮しつつ,推薦精度を測る指標を提案 クリックしたかどうかに加えて,アイテムの人気度に応じた重みを考慮した利得 (アイテムの人気度:クリックされた回数/全アイテムのクリック総数)
実験結果1 提案指標と既存指標にどれほどの相関があるか
実験結果2 推薦アルゴリズムの学習に提案手法を組み込んで,どれほど精度と人気バイアスに影響するか 推薦精度の毀損を抑えながら,人気バイアスを軽減
Normalised Cummlative Unity (NCU): ユーザの利得の期待値の形として一般化 $NCU = \displaystyle\sum_{r=1}^nP(r)G(r)$ $P(r)$: ユーザがランキングの$r$番目のアイテムに満足して停止する確率 $G(r)$: r番目のアイテムが得られる利得
$G(r) = \displaystyle \frac{C(r)}{B(r)}$ $C(r)$: {0, 1},$r$番目のアイテムがクリックされるか否か $B(r)$: $r$番目のアイテムの人気バイアス
$B(r) = \displaystyle \frac{N(r)}{T}$ $N(r)$: $r$番目のアイテムの総クリック数 $T$: データセットないの全アイテムの総クリック数
Popularity-aware ranking Metrics (PRM)
実験結果1
実験結果2 PRMを学習に活用: 検証データに対してPRM値を計算し,パラメータの更新を行うか否かを決定
PRMが増加したモデル
LLMにキャッチアップしていく際に、どのように論文を探していったらいいか書いてある。
機械学習モデルを学習するときにモデルの挙動を理解することは非常に重要。しかし、Deep系のネットワークだと中でどのような挙動をしているのか把握するのは困難なことが多く、これまでいろいろな可視化手法が生み出されてきた。このブログでは、
のそれぞれにおいて、どのようにしてモデルの挙動を調べることができるかがまとめられている。
購買済みのアイテムをランキングの末尾に移動させた(見えにくくした)ところ、購入するユーザーが増加したとのこと。完全に除外しないあたりが肝。
A/Bテストで見る指標多すぎ問題について。 全部いっぺんに見ずに、大事な指標から一つずつドリルダウンしていくのが効率的、みたいな話
部分集合に対するANNをしたいときにfaissでやる方法の紹介。 部分集合を事前に定義できるときは確かにこうやって処理するほうが早そう、知らなかった
Why
推薦・機械学習勉強会は、推薦や機械学習、その周辺技術を通じてサービスを改善することにモチベーションのある人達の集まりです。ニュースやブログから論文まで、気になったものについてお互い共有しましょう!
発信のため、ここは public にしてあります。外部からの参加をご希望の方は樋口(https://twitter.com/zerebom_3) まで DM を送るか、Wantedly Visit の募集(https://www.wantedly.com/projects/391912) よりご連絡ください!
What
Wantedly では隔週水曜日に
といった話をする「推薦・機械学習勉強会」を開催しています。 この ISSUE はその会で話すネタを共有するための場所です。
話したいことがある人はここにコメントしましょう! 会の間に話した内容もここにメモしましょう!
prev: https://github.com/wantedly/machine-learning-round-table/issues/222