Open nogawanogawa opened 8 months ago
https://recsyshr.aau.dk/wp-content/uploads/2023/09/RecSysHR2023-paper_1.pdf
Jens-Joris Decorte, Jeroen Van Hautte, Johannes Deleu, Chris Develder and Thomas Demeester
RECSYS IN HR 2023 Workshop
キャリアパス予測のパフォーマンスを計測
https://arxiv.org/abs/2207.06881
Aydar Bulatov, Yuri Kuratov, Mikhail S. Burtsev
NeurIPS 2022
Transformerではグローバルなシーケンスレベルの情報とローカルな情報が単一のembeddingに格納される。 この2つの情報を1つの表現に混在させるのは限界があり、全体の特徴がぼやけ、アクセスしにくくなる。
また、self attentionはスケーリングが良くないという問題もある。 長い入力に対する応用は現状まだまだ難しい。
ユーザがアイテムにインタラクションしてから目的の行動をするまでに遅延がある場合にどうやってデータをサンプルすればいいか提案した論文。
例えば広告の推薦を考えたとき、ユーザが広告をクリックしてすぐにconversion (e.g. 広告の商品の購入)するとは限らない。なので推薦モデルの学習時に使うモデルに直近のクリックログまで使ってしまうと、ラベルが正しくないデータが混ざってしまう危険性が大きい。かといってデータ取得期間を過去方向にずらすとデータの新鮮さが失われてしまう。
この論文では、ユーザ・アイテムごとにクリックからの期間に応じてラベルの信頼度を定量化してロス関数に重みをつけることによって、データセット品質を実質的に向上させモデル性能を向上させたということを述べている。
Why
Machine Learning 輪講は最新の技術や論文を追うことで、エンジニアが「技術で解決できること」のレベルをあげていくことを目的にした会です。
prev. https://github.com/wantedly/machine-learning-round-table/issues/213
What
話したいことがある人はここにコメントしましょう! 面白いものを見つけた時点でとりあえず話すという宣言だけでもしましょう!