wantedly / machine-learning-round-table

Gather around the table, and have a discussion to catch up the latest trend of machine learning 🤖
https://www.wantedly.com/projects/391912
297 stars 2 forks source link

[2023/10/11]Machine Learning 輪講 #215

Open nogawanogawa opened 8 months ago

nogawanogawa commented 8 months ago

Why

Machine Learning 輪講は最新の技術や論文を追うことで、エンジニアが「技術で解決できること」のレベルをあげていくことを目的にした会です。

prev. https://github.com/wantedly/machine-learning-round-table/issues/213

What

話したいことがある人はここにコメントしましょう! 面白いものを見つけた時点でとりあえず話すという宣言だけでもしましょう!

hakubishin3 commented 8 months ago

Career Path Prediction using Resume Representation Learning and Skill-based Matching

論文リンク

https://recsyshr.aau.dk/wp-content/uploads/2023/09/RecSysHR2023-paper_1.pdf

著者

Jens-Joris Decorte, Jeroen Van Hautte, Johannes Deleu, Chris Develder and Thomas Demeester

会議

RECSYS IN HR 2023 Workshop

背景

課題

アプローチ

キャリア予測タスク用の匿名データセットの作成・公開

大規模データセットを必要としないような手法の提案

実験結果

キャリアパス予測のパフォーマンスを計測

スクリーンショット 2023-10-11 18 30 20
nogawanogawa commented 8 months ago

Recurrent Memory Transformer

論文URL

https://arxiv.org/abs/2207.06881

著者

Aydar Bulatov, Yuri Kuratov, Mikhail S. Burtsev

会議

NeurIPS 2022

背景

Transformerではグローバルなシーケンスレベルの情報とローカルな情報が単一のembeddingに格納される。 この2つの情報を1つの表現に混在させるのは限界があり、全体の特徴がぼやけ、アクセスしにくくなる。

また、self attentionはスケーリングが良くないという問題もある。 長い入力に対する応用は現状まだまだ難しい。

目的

アプローチ

image

memo

https://github.com/nogawanogawa/paper_memo/issues/94

Hayashi-Yudai commented 8 months ago

Capturing Delayed Feedback in Conversion Rate Prediction via Elapsed-Time Sampling

ユーザがアイテムにインタラクションしてから目的の行動をするまでに遅延がある場合にどうやってデータをサンプルすればいいか提案した論文。

image

例えば広告の推薦を考えたとき、ユーザが広告をクリックしてすぐにconversion (e.g. 広告の商品の購入)するとは限らない。なので推薦モデルの学習時に使うモデルに直近のクリックログまで使ってしまうと、ラベルが正しくないデータが混ざってしまう危険性が大きい。かといってデータ取得期間を過去方向にずらすとデータの新鮮さが失われてしまう。

この論文では、ユーザ・アイテムごとにクリックからの期間に応じてラベルの信頼度を定量化してロス関数に重みをつけることによって、データセット品質を実質的に向上させモデル性能を向上させたということを述べている。