wantedly / machine-learning-round-table

Gather around the table, and have a discussion to catch up the latest trend of machine learning 🤖
https://www.wantedly.com/projects/391912
297 stars 2 forks source link

[2023/12/13]推薦・機械学習勉強会 #225

Open hakubishin3 opened 6 months ago

hakubishin3 commented 6 months ago

Why

推薦・機械学習勉強会は、推薦や機械学習、その周辺技術を通じてサービスを改善することにモチベーションのある人達の集まりです。ニュースやブログから論文まで、気になったものについてお互い共有しましょう!

発信のため、ここは public にしてあります。外部からの参加をご希望の方は樋口(https://twitter.com/zerebom_3) まで DM を送るか、Wantedly Visit の募集(https://www.wantedly.com/projects/391912) よりご連絡ください!

What

Wantedly では隔週水曜日に

といった話をする「推薦・機械学習勉強会」を開催しています。 この ISSUE はその会で話すネタを共有するための場所です。

話したいことがある人はここにコメントしましょう! 会の間に話した内容もここにメモしましょう!

prev: https://github.com/wantedly/machine-learning-round-table/issues/222

chimuichimu commented 6 months ago

Recursive Embedding and Clustering

サマリ

image

アプローチ

次元圧縮

PCA(左)とUMAP(右)のMNISTデータの次元圧縮の比較 image

クラスタリング

k-means(左)とHDBSCAN(右)のMNISTデータの次元圧縮の比較 image

結果の解釈

結果のまとめ

感想

KKaichi commented 6 months ago

推薦システムにおける人気バイアスを考慮したランキング評価指標

会議

DEIM2023,著者:飯塚洸二郎, 久保 光証, 森田 一 (Gunosy)

サマリ

人気バイアス評価指標

人気バイアスを考慮しつつ,推薦精度を測る指標を提案 クリックしたかどうかに加えて,アイテムの人気度に応じた重みを考慮した利得 (アイテムの人気度:クリックされた回数/全アイテムのクリック総数)

実験結果1 提案指標と既存指標にどれほどの相関があるか

実験結果2 推薦アルゴリズムの学習に提案手法を組み込んで,どれほど精度と人気バイアスに影響するか 推薦精度の毀損を抑えながら,人気バイアスを軽減

評価指標

Normalised Cummlative Unity (NCU): ユーザの利得の期待値の形として一般化 $NCU = \displaystyle\sum_{r=1}^nP(r)G(r)$ $P(r)$: ユーザがランキングの$r$番目のアイテムに満足して停止する確率 $G(r)$: r番目のアイテムが得られる利得

$G(r) = \displaystyle \frac{C(r)}{B(r)}$ $C(r)$: {0, 1},$r$番目のアイテムがクリックされるか否か $B(r)$: $r$番目のアイテムの人気バイアス

$B(r) = \displaystyle \frac{N(r)}{T}$ $N(r)$: $r$番目のアイテムの総クリック数 $T$: データセットないの全アイテムの総クリック数

Popularity-aware ranking Metrics (PRM)

結果

実験結果1

スクリーンショット 2023-12-12 22 59 38

実験結果2 PRMを学習に活用: 検証データに対してPRM値を計算し,パラメータの更新を行うか否かを決定

スクリーンショット 2023-12-12 23 04 46

PRMが増加したモデル

Hayashi-Yudai commented 6 months ago

LLM論文の探し方

LLMにキャッチアップしていく際に、どのように論文を探していったらいいか書いてある。

How to Visualize Deep Learning Models

機械学習モデルを学習するときにモデルの挙動を理解することは非常に重要。しかし、Deep系のネットワークだと中でどのような挙動をしているのか把握するのは困難なことが多く、これまでいろいろな可視化手法が生み出されてきた。このブログでは、

のそれぞれにおいて、どのようにしてモデルの挙動を調べることができるかがまとめられている。

nogawanogawa commented 6 months ago

購買済み商品の並び替えによる検索結果のパーソナライズ

購買済みのアイテムをランキングの末尾に移動させた(見えにくくした)ところ、購入するユーザーが増加したとのこと。完全に除外しないあたりが肝。

A/Bテストの情報過多と戦う

image

A/Bテストで見る指標多すぎ問題について。 全部いっぺんに見ずに、大事な指標から一つずつドリルダウンしていくのが効率的、みたいな話

faiss で部分集合を検索する

部分集合に対するANNをしたいときにfaissでやる方法の紹介。 部分集合を事前に定義できるときは確かにこうやって処理するほうが早そう、知らなかった