Large Scale Question Paraphrase Retrieval with Smoothed Deep Metric Learning - Githubissues

yskn67 / reading_papers

reading papers memorandum

MIT License

1 stars 0 forks source link

Large Scale Question Paraphrase Retrieval with Smoothed Deep Metric Learning #9

Open yskn67 opened 4 years ago

yskn67 commented 4 years ago

一言でいうと

Quoraなどの質問投稿サイトにおける類似質問を検索するシステムの提案類似質問のペアからmetric learningする想定実システムだとすべてのペアを網羅できるわけではないのでfalse positiveなデータが学習セットに含まれるこの影響を弱めるためにtriplet lossの代わりにsmoothed deep metric lossを提案 triplet lossと比較して複数のデータセットに対してoutperform

スクリーンショット 2020-02-16 1 43 18 スクリーンショット 2020-02-16 1 43 41

SGNSのようなloss

論文リンク

https://www.aclweb.org/anthology/D19-5509.pdf

著者/所属機関

Daniele Bonadiman(University of Trento) Anjishnu Kumar(Amazon Alexa) Arpit Mittal(Amazon Alexa)

投稿日付(yyyy/MM/dd)

2019

概要

新規性・差分

手法

結果

コメント

yskn67 commented 4 years ago

システム図スクリーンショット 2020-02-16 1 46 23 EncoderはCNN -> Global Max Pooling -> Denseのような形出現回数が低い単語はhash trickを使ってrandom projection

yskn67 commented 4 years ago

hash trick https://arxiv.org/abs/0902.2206 CNNとRNNの比較 https://arxiv.org/abs/1702.01923 データセットの作り方 https://www.aclweb.org/anthology/P18-1206/