tm4roon / survey

Survey on machine learning.
14 stars 1 forks source link

Domain Control for Neural Machine Translation #23

Open tm4roon opened 5 years ago

tm4roon commented 5 years ago

Domain Control for Neural Machine Translation

機械翻訳において、学習データと異なるドメインのテストデータに用いた場合には、性能が低い傾向にある。ここでは、学習データのドメインを文末にタグとして挿入する手法と、ドメイン埋め込みを導入し、token-levelでモデルに入力する手法の2つを用いて翻訳性能の改善を試みている。各ドメインのコーパス単体で学習させたモデルよりも、あらゆるドメインを同時に学習させたモデルの方が、全てのドメインで高い性能を達成した。また、ドメインタグを挿入するよりも、ドメイン埋め込みを用いた方が性能を改善できることを示した。

ドメインタグ

ドメイン埋め込み

文献情報