karakuri-ai / paper-readings

repository to research the machine learning papers
2 stars 1 forks source link

[2019] Multi-view Embedding-based Synonyms for Email Search #40

Open IkokObi opened 5 years ago

IkokObi commented 5 years ago

ざっくり言うと

キーワード

1. 情報

論文リンク

https://dl.acm.org/citation.cfm?id=3331250

著者

Cheng Li, Mingyang Zhang, Michael Bendersky, Hongbo Deng, Donald Metzler, Marc Najork (Google, Alibaba)

投稿日付

2019/7/21-25 (SIGIR 2019)

2. 先行研究と比べてどこがすごい?

3. 技術や手法のキモはどこ?

4. どうやって有効だと検証した?

5. 議論はある?

6. 次に読むべき論文は?

IkokObi commented 5 years ago

7. 実装の詳細

大きく分けて3段階からなる

  1. 3つ観点からembeddingを学習し,類似度を計算して候補を出力
  2. Label propagation を用いてノイズを除去
  3. ランク学習でリランク

Embeddingについて

データの匿名化の関係で,文章は全てn-gramのbag-of-wordsになっていることに注意.3つの観点でembeddingする.

  1. 入力キーワードとクリックされたメール
  2. 一連の検索セッションで入力されたキーワード
  3. ユーザごとの入力キーワード

学習の目的関数は2つで,

また,略語などの語変化にも対応するため,文字n-gramも考慮してembeddingしている.

ランク学習について

RankLib libraryを用いて,複数の手法を比較している

IkokObi commented 5 years ago

8. データセット

IkokObi commented 5 years ago

9. 結果の詳細

IkokObi commented 5 years ago

雑感&メモ