cfiken / paper-reading

34 stars 3 forks source link

[2021] DialogueCSE: Dialogue-based Contrastive Learning of Sentence Embeddings #155

Open cfiken opened 3 years ago

cfiken commented 3 years ago

0. 論文

タイトル DialogueCSE: Dialogue-based Contrastive Learning of Sentence Embeddings
リンク https://arxiv.org/abs/2109.12599
著者 Che Liu, Rui Wang, Jinghua Liu, Jian Sun, Fei Huang, Luo Si (Alibaba Group)
投稿日付 EMNLP2021 2021/9/26 on arxiv

1. どんなもの?

対話データセットを用いた contrastive learning の手法 DialogueCSE を提案。 ある対話(発話の集合)の内の1つを返答と見た時に、返答だけから BERT で作る context-free embedding と、他の発話(コンテキスト)を使った提案手法 matching guided embedding (MGE) mechanism によって context-aware embedding を作成し、この2つを positive pair とし、同様の処理をコンテキストを固定し返答をデータセットからランダムサンプリングして得られる embedding の組を negative pair として学習を行う。 対話データでの評価方法も確立し、siamese などの既存手法と比べてスコアを大きく改善した。

2. 先行研究と比べてどこがすごい?

3. 技術や手法のキモはどこ?

スクリーンショット 2021-09-28 23 38 27

4. どうやって有効だと検証した?

5. 議論はある?

6. 次に読むべき論文は?