Open hakubishin3 opened 1 year ago
CVPR'22の論文。MobileNetとTransformerを並列に組み合わせ、それらの間に双方向ブリッジをかけることによって高速、かつ高精度に物体認識等のタスクを実現できたという論文。
MobileNet-V3より精度は1.3 %向上 + 計算コスト17 %削減
https://arxiv.org/abs/2204.12811
Mike Zhang, Kristian Nørgaard Jensen, Sif Dam Sonniks, Barbara Plank
NAACL 2022
採用マーケットは常に変化し、必要とされるスキルセットも変化している。 求人情報から必要な能力を抽出するスキルエクストラクションはこれを自動化する技術である。
しかし、データセットやアノテーションガイドラインの不足によって進展が阻害されている。 先行研究のデータセットはあまり公開されておらず、アノテーションのガイドラインも公開されていないため曖昧なものになっている。
アノテーションガイドラインと、それを用いたデータセットの公開
モデルというよりは、データセットの作り方の話
ジョブと求職者のマッチングを実現するためには、ノイジーな情報を含んでいる非構造化な求人情報を理解する必要がある。Linkedin では求人情報を様々な専門的なエンティティで表現できるよう深層モデルを利用しており、この性能を継続的に改善するためにプロダクト上で求人投稿者のフィードバックを収集するフィードバックループを設計している。
求人情報に含まれる幅広いトピック(会社の説明、仕事の資格、福利厚生など)を推薦などのタスクで明示的にモデル化できるようにするために、求人情報を入力として構造化されたトピックを出力する求人情報の理解モデルを開発する。具体的には、求人情報を、仕事の職種、企業、仕事に必要なスキル、資格など、仕事の特徴を表す専門的なエンティティに標準化している。
求人情報の標準化はユーザフィードバックループとダウンストリームタスクの2つのフェイズで構成されており、ユーザフィードバックループではアノテーションデータを元に仕事の標準化タスクを実施し、最新の標準化結果を下流に流す。
ドメインに精通していないアノテータのラベリングよりも、ドメインや市場を理解しているアノテータから質の高いデータを取得する仕組みを作ることが重要である。そのため、求人を作成した企業ユーザからのフィードバックを得られるような仕組みを構築している。
job descriptionの入力から、その内容を処理して job targeting skill の suggest を行っている。求人作成者からスキル情報を求めるだけでなく、作業負担の軽減もセットで狙っている。
こちらはフィードのニュース記事におけるユーザフィードバック。標準化された企業エンティティの誤りを受け取れるようにする。
Why
Machine Learning 輪講は最新の技術や論文を追うことで、エンジニアが「技術で解決できること」のレベルをあげていくことを目的にした会です。
prev. https://github.com/wantedly/machine-learning-round-table/issues/176
What
話したいことがある人はここにコメントしましょう! 面白いものを見つけた時点でとりあえず話すという宣言だけでもしましょう!