Open DaikiTanak opened 4 years ago
https://arxiv.org/pdf/1908.10084.pdf
BERTから得られる文埋め込み(CLS tokenの出力や、出力平均)は文埋め込みとして最適ではない。 文間の類似度を教師データを用いて、BERTの出力を文埋め込みとして使う。
文間の類似度を教師として与える。
link to paper
https://arxiv.org/pdf/1908.10084.pdf
introduction
BERTから得られる文埋め込み(CLS tokenの出力や、出力平均)は文埋め込みとして最適ではない。 文間の類似度を教師データを用いて、BERTの出力を文埋め込みとして使う。
problem setting
文間の類似度を教師として与える。