Open cfiken opened 3 years ago
対話データセットを用いた contrastive learning の手法 DialogueCSE を提案。 ある対話(発話の集合)の内の1つを返答と見た時に、返答だけから BERT で作る context-free embedding と、他の発話(コンテキスト)を使った提案手法 matching guided embedding (MGE) mechanism によって context-aware embedding を作成し、この2つを positive pair とし、同様の処理をコンテキストを固定し返答をデータセットからランダムサンプリングして得られる embedding の組を negative pair として学習を行う。 対話データでの評価方法も確立し、siamese などの既存手法と比べてスコアを大きく改善した。
0. 論文
1. どんなもの?
対話データセットを用いた contrastive learning の手法 DialogueCSE を提案。 ある対話(発話の集合)の内の1つを返答と見た時に、返答だけから BERT で作る context-free embedding と、他の発話(コンテキスト)を使った提案手法 matching guided embedding (MGE) mechanism によって context-aware embedding を作成し、この2つを positive pair とし、同様の処理をコンテキストを固定し返答をデータセットからランダムサンプリングして得られる embedding の組を negative pair として学習を行う。 対話データでの評価方法も確立し、siamese などの既存手法と比べてスコアを大きく改善した。
2. 先行研究と比べてどこがすごい?
3. 技術や手法のキモはどこ?
4. どうやって有効だと検証した?
5. 議論はある?
6. 次に読むべき論文は?