Closed nogawanogawa closed 2 years ago
汎用検索エンジンの進歩は目覚ましいが、求人検索エンジンの進歩はそれに比べてまだまだ進歩は緩やかである。 その理由にはいくつか考えられる。
求人検索エンジンの性能向上
JD・CVマッチングの全体像は下記図のようになっている。
主な構成要素としては、
skill抽出は、与えられたCV/JDを1つの文書として扱い、そこからskillを抽出する役割を担う。 ここでは、3種類の手法を用いてskillの語句をscoreとともに抽出される。
固有表現抽出によって、名詞句をスキルや技術用語としてピックする
アノテーターによるスキルの語句を抽出するルールを作った
抽出されたスキル候補は, Skill Dictionaryに格納されている語句とw2vで距離を算出し、その距離によってスキルかどうかを判定する。
SkillにはSkill Dictionaryで管理されている。 Onet と Hope listを参考に、アノテータによって選ばれた53,293語の技術・ソフトスキルの語句ががスキル辞書に登録され使用されている。
“Need candidates with ability to code in Python, Java, and Octave."
それらのCupを取る
その後、各Probable Skill Setに対して、Skill dictionaryとcos simの最大値を取得する。
その後、下記の式によって関係スコアを計算する。
関係スコアが0.35をしきい値とし、それより上回ったものをスキルとして扱う。
precision of 0.78 and a recall of 0.88, giving an F1-score of 0.83.
implicit なスキルも使ったほうが良いらしい
別のデータセットを使っても同様の傾向が見えた
論文URL
https://ojs.aaai.org//index.php/AAAI/article/view/7038
著者
Akshay Gugnani, Hemant Misra
会議
IAAI '20
背景
汎用検索エンジンの進歩は目覚ましいが、求人検索エンジンの進歩はそれに比べてまだまだ進歩は緩やかである。 その理由にはいくつか考えられる。
目的
求人検索エンジンの性能向上
アプローチ