arXivTimes / arXivTimes

repository to research & share the machine learning articles
https://arxivtimes.herokuapp.com/
MIT License
3.9k stars 201 forks source link

Margin-based Parallel Corpus Mining with Multilingual Sentence Embeddings #1468

Open icoxfog417 opened 4 years ago

icoxfog417 commented 4 years ago

一言でいうと

多言語の分散表現を得る手法(LASER)。Bi-directional LSTMのEncoder/Decoderが基本で、Encoderで処理した文はMax-poolをとり、Decode時に常に言語IDとともにconcatする。Encoderが言語独立の表現獲得を担当し、Decoderが言語固有の復元を担当する形で学習を行う。

image

論文リンク

https://www.aclweb.org/anthology/P19-1309/

著者/所属機関

Mikel Artetxe, Holger Schwenk

投稿日付(yyyy/MM/dd)

2018/11/3

概要

新規性・差分

手法

結果

コメント

icoxfog417 commented 4 years ago

実装 https://github.com/facebookresearch/LASER