nogawanogawa commented 8 months ago

Why

Machine Learning 輪講は最新の技術や論文を追うことで、エンジニアが「技術で解決できること」のレベルをあげていくことを目的にした会です。

prev. https://github.com/wantedly/machine-learning-round-table/issues/213

What

話したいことがある人はここにコメントしましょう！面白いものを見つけた時点でとりあえず話すという宣言だけでもしましょう！

hakubishin3 commented 8 months ago

Career Path Prediction using Resume Representation Learning and Skill-based Matching

論文リンク

https://recsyshr.aau.dk/wp-content/uploads/2023/09/RecSysHR2023-paper_1.pdf

著者

Jens-Joris Decorte, Jeroen Van Hautte, Johannes Deleu, Chris Develder and Thomas Demeester

会議

RECSYS IN HR 2023 Workshop

背景

労働者とジョブの適合具合が仕事のパフォーマンスに大きく影響を与える
社内配置の最適化のためにキャリアパス予測が重要

課題

既存のキャリアパス予測のアプローチは、(company, job)のキャリア遷移を学習するもの。スパースなので、基本的には大量のデータが必要となる
キャリアデータは個人情報なので基本的にクローズド、キャリアパス予測の開発と評価のためのオープンなデータセットが不十分

アプローチ

キャリア予測タスク用の匿名データセットの作成・公開

URL: https://huggingface.co/datasets/jensjorisdecorte/anonymous-working-histories
24業界にわたる2,164件のキャリア履歴
ジョブタイトルや自由形式の説明あり
ECSOの職業分類結果が付与されている

大規模データセットを必要としないような手法の提案

スキルベース予測モデル
- キャリア履歴が与えられたとき、関連する全てのスキルの集合を取る
- 各職業に紐づいたスキルとスキル集合の類似度を、次の職業と労働者の近さと定義する
テキストベース予測モデル
- ジョブのテキスト情報を扱えるよう CareerBERT を提案

実験結果

キャリアパス予測のパフォーマンスを計測

nogawanogawa commented 8 months ago

Recurrent Memory Transformer

論文URL

https://arxiv.org/abs/2207.06881

著者

Aydar Bulatov, Yuri Kuratov, Mikhail S. Burtsev

会議

NeurIPS 2022

背景

Transformerではグローバルなシーケンスレベルの情報とローカルな情報が単一のembeddingに格納される。この2つの情報を1つの表現に混在させるのは限界があり、全体の特徴がぼやけ、アクセスしにくくなる。

また、self attentionはスケーリングが良くないという問題もある。長い入力に対する応用は現状まだまだ難しい。

目的

長いシーケンスを使用してもTransformerの精度を維持する

アプローチ

Recurrent Memory Transformer
- 入力シーケンスに対して、特別なメモリートークン付与し予約容量をモデルに提供
- シーケンスをセグメントに分割し、前のセグメントの情報をメモリートークンを介して次のセグメントへ伝播する

memo

https://github.com/nogawanogawa/paper_memo/issues/94

Hayashi-Yudai commented 8 months ago

Capturing Delayed Feedback in Conversion Rate Prediction via Elapsed-Time Sampling

ユーザがアイテムにインタラクションしてから目的の行動をするまでに遅延がある場合にどうやってデータをサンプルすればいいか提案した論文。

例えば広告の推薦を考えたとき、ユーザが広告をクリックしてすぐにconversion (e.g. 広告の商品の購入)するとは限らない。なので推薦モデルの学習時に使うモデルに直近のクリックログまで使ってしまうと、ラベルが正しくないデータが混ざってしまう危険性が大きい。かといってデータ取得期間を過去方向にずらすとデータの新鮮さが失われてしまう。

この論文では、ユーザ・アイテムごとにクリックからの期間に応じてラベルの信頼度を定量化してロス関数に重みをつけることによって、データセット品質を実質的に向上させモデル性能を向上させたということを述べている。

wantedly / machine-learning-round-table

[2023/10/11]Machine Learning 輪講 #215

Why

What

Career Path Prediction using Resume Representation Learning and Skill-based Matching

論文リンク

著者

会議

背景

課題

アプローチ

キャリア予測タスク用の匿名データセットの作成・公開

大規模データセットを必要としないような手法の提案

実験結果

Recurrent Memory Transformer

論文URL

著者

会議

背景

目的

アプローチ

memo

Capturing Delayed Feedback in Conversion Rate Prediction via Elapsed-Time Sampling