Open nogawanogawa opened 1 year ago
連合学習で使うアイテムのembeddingを、globalなものとユーザーにパーソナライズされたものの2つに分けて使うことで推薦性能の向上を実現したという論文。
連合学習では個々人の持っているデータの分布がユーザーによって大きく異る(heterogenety)ことが学習の際の大きな問題になっていた。この論文では、ユーザーに依存しないアイテムの特徴をglobal embeddingに、ユーザーの傾向をlocal embeddingに分離、そしてlocal embeddingの利用範囲をユーザーデバイス内で閉じることでユーザープライバシーを保護しつつ、高精度な推薦モデルの学習を実現している。
https://arxiv.org/abs/2210.07774
Malay Haldar, Mustafa Abdool, Liwei He, Dillon Davis, Huiji Gao, Sanjeev Katariya
?
Airbnbのランキングシステムでは、予約確率に基づいてランキングを生成している。 この予約確率は、ユーザーの多数派に強く影響され、少数のログの影響は小さくなりがちになり、結果として多数派の意見が強く反映された多様性の少ないランキングになってしまう。
少数派のユーザーの嗜好を考慮し、検索結果全体の有用性の向上
データセットの一番上の順位のアイテムがbookingされているデータはすべて破棄し、一番上が予約されなかったデータでランク学習する
一番上のデータとの類似度でペナルティをかけてスコアリング
Why
Machine Learning 輪講は最新の技術や論文を追うことで、エンジニアが「技術で解決できること」のレベルをあげていくことを目的にした会です。
prev. https://github.com/wantedly/machine-learning-round-table/issues/182
What
話したいことがある人はここにコメントしましょう! 面白いものを見つけた時点でとりあえず話すという宣言だけでもしましょう!