DaikiTanak / MLPapers

0 stars 0 forks source link

Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks #6

Open DaikiTanak opened 4 years ago

DaikiTanak commented 4 years ago

link to paper

https://arxiv.org/pdf/1908.10084.pdf

introduction

BERTから得られる文埋め込み(CLS tokenの出力や、出力平均)は文埋め込みとして最適ではない。 文間の類似度を教師データを用いて、BERTの出力を文埋め込みとして使う。

problem setting

文間の類似度を教師として与える。