wantedly / machine-learning-round-table

Gather around the table, and have a discussion to catch up the latest trend of machine learning 🤖
https://www.wantedly.com/projects/391912
297 stars 2 forks source link

[2024/02/28]Machine Learning 輪講 #236

Open nogawanogawa opened 4 months ago

nogawanogawa commented 4 months ago

Why

Machine Learning 輪講は最新の技術や論文を追うことで、エンジニアが「技術で解決できること」のレベルをあげていくことを目的にした会です。

prev. https://github.com/wantedly/machine-learning-round-table/issues/234

What

話したいことがある人はここにコメントしましょう! 面白いものを見つけた時点でとりあえず話すという宣言だけでもしましょう!

chimuichimu commented 4 months ago

MerRec: A Large-scale Multipurpose Mercari Dataset for Consumer-to-Consumer Recommendation Systems

概要

メルカリUSがConsumer-to-Consumer (C2C) 推薦用のデータセットを発表。メルカリUS上で発生した6ヶ月間分の商品データ・ユーザ行動データから作成されており、世界初の大規模なC2Cレコメンド用データセットとのこと。本論文ではデータセットの詳細に加え、データセットを使用した各タスクのベンチマークや推薦モデル(Mercatran)の提案がなされている。

背景

推薦システムの研究は、主流なビジネスモデルである (B2C)モデルをターゲットにしたものがメインだった。しかし近年はメルカリをはじめとしたC2Cモデルのプラットフォームの発展が目覚ましい。C2Cモデルは、アイテムは基本1点もの・ユーザが買手または売手の双方となり得る、など独自の特性を有しているため、C2Cモデルにおける推薦システムの発展にはC2C用のデータセットが必要である。

データセット

特徴

項目とサイズ

image

想定タスク

ライセンス

CC BY-NC 4.0 International

リンク

Hayashi-Yudai commented 4 months ago

Alternating Linear Bandits for Online Matrix-Factorization Recommendation

行列分解をオンライン学習する手法の提案。 この論文では optimism in the face of uncertainty linear bandit algorithm (OFUL) をベースとしてた手法を使って行列分解を学習している。バンディットと行列分解を組み合わせることでオンライン環境での推薦を行う研究はこれまでもあったが、この論文ではさらにALSを組み合わせることによって性能の向上を実現している。

Book Crossingを使ったオフラインでの検証結果

image

ALBが提案手法。PTSとNMFはバンディットと行列分解を組み合わせた先行研究。実験の際にはユーザーのratingは全くない状況から始めており、コールドスタート状態を仮定している。この状況において提案手法が他の類似手法と比べて良い性能になっていることが示されている。

nogawanogawa commented 4 months ago

Learning to Retrieve for Job Matching

論文URL

https://arxiv.org/abs/2402.13435

著者

Jianqiang Shen, Yuchin Juan, Shaobo Zhang, Ping Liu, Wen Pu, Sriram Vasudevan, Qingquan Song, Fedor Borisyuk, Kay Qianqi Shen, Haichao Wei, Yunxiang Ren, Yeou S. Chiou, Sicong Kuang, Yuan Yin, Ben Zheng, Muchen Wu, Shaghayegh Gharghabi, Xiaoqing Wang, Huichao Xue, Qi Guo, Daniel Hewlett, Luke Simon, Liangjie Hong, Wenjing Zhang

会議

KDD 2024 (予定)

背景

LinkedInは、毎週6500万人以上のユニークでアクティブな求職者と、数千万件の無料(無記名)および有料(プロモーション)の求人情報を含む経済的機会を結んでいる。

ユーザーの50%は10分以内に再アクセスしている。

image

現状の求人検索システムは下記の様になっている

image

目的

linkedInの求人検索と推薦システムを強化

アプローチ

TWO TOWER

two towerのアーキテクチャはwide and deepモデルを使っている模様

image

実装

テキストで絞り込んでからembeddingで更に絞り込むことで15M -> 1Kにcandidateを絞るらしい

image

memo

https://github.com/nogawanogawa/paper_memo/issues/106