Open nogawanogawa opened 4 months ago
メルカリUSがConsumer-to-Consumer (C2C) 推薦用のデータセットを発表。メルカリUS上で発生した6ヶ月間分の商品データ・ユーザ行動データから作成されており、世界初の大規模なC2Cレコメンド用データセットとのこと。本論文ではデータセットの詳細に加え、データセットを使用した各タスクのベンチマークや推薦モデル(Mercatran)の提案がなされている。
推薦システムの研究は、主流なビジネスモデルである (B2C)モデルをターゲットにしたものがメインだった。しかし近年はメルカリをはじめとしたC2Cモデルのプラットフォームの発展が目覚ましい。C2Cモデルは、アイテムは基本1点もの・ユーザが買手または売手の双方となり得る、など独自の特性を有しているため、C2Cモデルにおける推薦システムの発展にはC2C用のデータセットが必要である。
item_view
とitem_like
といった複数の行動を同時に予測行列分解をオンライン学習する手法の提案。 この論文では optimism in the face of uncertainty linear bandit algorithm (OFUL) をベースとしてた手法を使って行列分解を学習している。バンディットと行列分解を組み合わせることでオンライン環境での推薦を行う研究はこれまでもあったが、この論文ではさらにALSを組み合わせることによって性能の向上を実現している。
Book Crossingを使ったオフラインでの検証結果
ALBが提案手法。PTSとNMFはバンディットと行列分解を組み合わせた先行研究。実験の際にはユーザーのratingは全くない状況から始めており、コールドスタート状態を仮定している。この状況において提案手法が他の類似手法と比べて良い性能になっていることが示されている。
https://arxiv.org/abs/2402.13435
Jianqiang Shen, Yuchin Juan, Shaobo Zhang, Ping Liu, Wen Pu, Sriram Vasudevan, Qingquan Song, Fedor Borisyuk, Kay Qianqi Shen, Haichao Wei, Yunxiang Ren, Yeou S. Chiou, Sicong Kuang, Yuan Yin, Ben Zheng, Muchen Wu, Shaghayegh Gharghabi, Xiaoqing Wang, Huichao Xue, Qi Guo, Daniel Hewlett, Luke Simon, Liangjie Hong, Wenjing Zhang
KDD 2024 (予定)
LinkedInは、毎週6500万人以上のユニークでアクティブな求職者と、数千万件の無料(無記名)および有料(プロモーション)の求人情報を含む経済的機会を結んでいる。
ユーザーの50%は10分以内に再アクセスしている。
現状の求人検索システムは下記の様になっている
linkedInの求人検索と推薦システムを強化
two towerのアーキテクチャはwide and deepモデルを使っている模様
テキストで絞り込んでからembeddingで更に絞り込むことで15M -> 1Kにcandidateを絞るらしい
Why
Machine Learning 輪講は最新の技術や論文を追うことで、エンジニアが「技術で解決できること」のレベルをあげていくことを目的にした会です。
prev. https://github.com/wantedly/machine-learning-round-table/issues/234
What
話したいことがある人はここにコメントしましょう! 面白いものを見つけた時点でとりあえず話すという宣言だけでもしましょう!