Yuanmeng Yan, Rumei Li, Sirui Wang, Fuzheng Zhang, Wei Wu, Weiran Xu

概要

従来のBERT系モデルは文書類似タスク(STS)に弱いことが知られている。自己教師ありContrasive learningをBERTに適用することでSTS, NLIでより良いスコアを得られるようになったとのこと。教師あり手法であるsentence-BERTをしのぐこともある。

SlimCLRから着想を得ており、オリジナルセンテンスと、データ拡張結果とのcontrasive learningを行う。データ拡張方法は単語埋め込み層に対し主に4つを行う。

STSタスクでの精度向上以外にも、NLUでよい結果を得られた。

knok / arxiv-memo