Open Sosuke115 opened 3 years ago
https://arxiv.org/pdf/2109.05424.pdf
S-BERTなどのNLIデータセットでの学習における文ペアにおいて、矛盾ペアが必ずしも異なるセマンティクスに所属しているわけではなく、ハイレベルなコンセプトを捉えた文表現になっていない。
その問題を解決するためにpositive pairを他のペアから識別する 以下のinstance discrimination lossをSBERTのtripletロスに追加
SimCSEと上記目的関数は似ているが、negative exampleに重みをつけている。 重みαはペアの類似度(ziと他のネガティブサンプルと比較した際の相対的な価値)から計算
STSだとSimCSEに若干負けてるが、short text classificationでは勝っている
メモ: タスクも参考になりそう
メモ: devデータをどうしているか
論文リンク
https://arxiv.org/pdf/2109.05424.pdf
概要
S-BERTなどのNLIデータセットでの学習における文ペアにおいて、矛盾ペアが必ずしも異なるセマンティクスに所属しているわけではなく、ハイレベルなコンセプトを捉えた文表現になっていない。
その問題を解決するためにpositive pairを他のペアから識別する 以下のinstance discrimination lossをSBERTのtripletロスに追加
SimCSEと上記目的関数は似ているが、negative exampleに重みをつけている。 重みαはペアの類似度(ziと他のネガティブサンプルと比較した際の相対的な価値)から計算
STSだとSimCSEに若干負けてるが、short text classificationでは勝っている