karakuri-ai / paper-readings

repository to research the machine learning papers
2 stars 1 forks source link

[2020] Language-agnostic BERT Sentence Embedding #59

Open IkokObi opened 3 years ago

IkokObi commented 3 years ago

ざっくり言うと

多言語での文章埋め込み(Sentence embedding)を学習するモデル(LaBSE)の研究。BERT由来のMasked language model(MLM)と多言語対応のための翻訳言語モデル、そして文章埋め込みを学習するために距離学習のような学習を取り入れることで精度を向上させた。学習済みモデルをTensorFlow Hubで公開している。

キーワード

1. 情報

論文リンク

https://arxiv.org/abs/2007.01852

著者

Fangxiaoyu Feng, Yinfei Yang, Daniel Cer, Naveen Arivazhagan, Wei Wang Google AI

投稿日付

2020/7/3

2. 先行研究と比べてどこがすごい?

3. 技術や手法のキモはどこ?

4. どうやって有効だと検証した?

5. 議論はある?

6. 次に読むべき論文は?

IkokObi commented 3 years ago

7. 実装の詳細

IkokObi commented 3 years ago

8. データセット

IkokObi commented 3 years ago

9. 結果の詳細

IkokObi commented 3 years ago

雑感&メモ