Sosuke115 / paper-reading

4 stars 1 forks source link

A Survey of Domain Adaptation for Neural Machine Translation [COLING, 2020] #33

Open Sosuke115 opened 3 years ago

Sosuke115 commented 3 years ago

ひとことで言うと

NMTに関するドメイン適応のサーベイ論文

論文リンク

https://www.aclweb.org/anthology/C18-1111.pdf

モノリンガルコーパスの必要

言語モデルにターゲットドメインデータをうまく組み込む系

擬似対訳コーパスの利用

ソース側、ターゲット側の両側で実験されている (forward、back translation) Domain, Translationese and Noise in Synthetic Data for Neural Machine Translation

マルチドメイン設定

Neural machine translation training in a multi-domain scenario マルチドメイン適応について 単に連結して学習、それぞれのドメインコーパスで順番に学習、ドメインが近いデータを選別、独立に学習してアンサンブルを試している →単に連結して学習し、欲しいドメインでfine-tuneするのが一番よかった

Mixed Fine Tuning ドメイン外のデータで学習→ドメイン外+ドメイン内のデータでfine-tune

その他 Multilingual Multi-Domain Adaptation Approaches for Neural Machine Translation

ドメイン識別器を使う手法

Effective domain mixing for neural machine translation

Screen Shot 2020-10-13 at 22 43 41

ドメインベクトルをword embeddingに連結

関連論文