hakubishin3 commented 1 year ago

Why

Machine Learning 輪講は最新の技術や論文を追うことで、エンジニアが「技術で解決できること」のレベルをあげていくことを目的にした会です。

prev. https://github.com/wantedly/machine-learning-round-table/issues/176

What

話したいことがある人はここにコメントしましょう！面白いものを見つけた時点でとりあえず話すという宣言だけでもしましょう！

Hayashi-Yudai commented 1 year ago

Mobile-Former: Bridging MobileNet and Transformer

CVPR'22の論文。MobileNetとTransformerを並列に組み合わせ、それらの間に双方向ブリッジをかけることによって高速、かつ高精度に物体認識等のタスクを実現できたという論文。

MobileNet-V3より精度は1.3 %向上 + 計算コスト17 %削減

nogawanogawa commented 1 year ago

SKILLSPAN: Hard and Soft Skill Extraction from English Job Postings

論文URL

https://arxiv.org/abs/2204.12811

著者

Mike Zhang, Kristian Nørgaard Jensen, Sif Dam Sonniks, Barbara Plank

会議

NAACL 2022

背景

採用マーケットは常に変化し、必要とされるスキルセットも変化している。求人情報から必要な能力を抽出するスキルエクストラクションはこれを自動化する技術である。

しかし、データセットやアノテーションガイドラインの不足によって進展が阻害されている。先行研究のデータセットはあまり公開されておらず、アノテーションのガイドラインも公開されていないため曖昧なものになっている。

目的

アノテーションガイドラインと、それを用いたデータセットの公開

アプローチ

SKILLSPAN
- スキルと知識の構成要素を範囲レベルで表記した新しいデータセット
- これを用いたドメイン適用型BERTとしてJobBERT, JobSpanBERTを公開し、このタスクに対する強力なベースラインを示す

メモ

モデルというよりは、データセットの作り方の話

https://github.com/nogawanogawa/paper_memo/issues/71

hakubishin3 commented 1 year ago

Deep Job Understanding at LinkedIn

ジョブと求職者のマッチングを実現するためには、ノイジーな情報を含んでいる非構造化な求人情報を理解する必要がある。Linkedin では求人情報を様々な専門的なエンティティで表現できるよう深層モデルを利用しており、この性能を継続的に改善するためにプロダクト上で求人投稿者のフィードバックを収集するフィードバックループを設計している。

Job Standardization

求人情報に含まれる幅広いトピック（会社の説明、仕事の資格、福利厚生など）を推薦などのタスクで明示的にモデル化できるようにするために、求人情報を入力として構造化されたトピックを出力する求人情報の理解モデルを開発する。具体的には、求人情報を、仕事の職種、企業、仕事に必要なスキル、資格など、仕事の特徴を表す専門的なエンティティに標準化している。

求人情報の標準化はユーザフィードバックループとダウンストリームタスクの２つのフェイズで構成されており、ユーザフィードバックループではアノテーションデータを元に仕事の標準化タスクを実施し、最新の標準化結果を下流に流す。

Job Posting Flow Feedback

ドメインに精通していないアノテータのラベリングよりも、ドメインや市場を理解しているアノテータから質の高いデータを取得する仕組みを作ることが重要である。そのため、求人を作成した企業ユーザからのフィードバックを得られるような仕組みを構築している。

job descriptionの入力から、その内容を処理して job targeting skill の suggest を行っている。求人作成者からスキル情報を求めるだけでなく、作業負担の軽減もセットで狙っている。

こちらはフィードのニュース記事におけるユーザフィードバック。標準化された企業エンティティの誤りを受け取れるようにする。

zerebom commented 1 year ago

Elliot: A Comprehensive and Rigorous Framework for Reproducible Recommender Systems Evaluation

実装: https://github.com/sisinflab/elliot
SIGIR2021の再現性のある推薦システム評価のための包括的かつ厳密なフレームワークを紹介した論文
従来の提案される推薦システムは、データのsplit, 評価関数, タスクの設計など、モデル以外に様々な変数があるため比較が難しい。この問題を解決したフレームワーク。
1枚のyamlファイルを書くだけで、データのsplit, ハイパラチューン、複数指標での評価、モデル内統計量の出力などが可能
RecBoleなどに比べても多くのモデルに対応している
InputにはUser featureやimageなどを追加することができる
ドキュメントもかなり整備されていそう
今後は強化学習やSequentialモデルなどに対応する予定

wantedly / machine-learning-round-table

[2023/01/05]Machine Learning 輪講 #178

Why