Open Sosuke115 opened 3 years ago
NMTに関するドメイン適応のサーベイ論文
https://www.aclweb.org/anthology/C18-1111.pdf
言語モデルにターゲットドメインデータをうまく組み込む系
ソース側、ターゲット側の両側で実験されている (forward、back translation) Domain, Translationese and Noise in Synthetic Data for Neural Machine Translation
Neural machine translation training in a multi-domain scenario マルチドメイン適応について 単に連結して学習、それぞれのドメインコーパスで順番に学習、ドメインが近いデータを選別、独立に学習してアンサンブルを試している →単に連結して学習し、欲しいドメインでfine-tuneするのが一番よかった
Mixed Fine Tuning ドメイン外のデータで学習→ドメイン外+ドメイン内のデータでfine-tune
その他 Multilingual Multi-Domain Adaptation Approaches for Neural Machine Translation
Effective domain mixing for neural machine translation
ひとことで言うと
NMTに関するドメイン適応のサーベイ論文
論文リンク
https://www.aclweb.org/anthology/C18-1111.pdf
モノリンガルコーパスの必要
言語モデルにターゲットドメインデータをうまく組み込む系
擬似対訳コーパスの利用
ソース側、ターゲット側の両側で実験されている (forward、back translation) Domain, Translationese and Noise in Synthetic Data for Neural Machine Translation
マルチドメイン設定
Neural machine translation training in a multi-domain scenario マルチドメイン適応について 単に連結して学習、それぞれのドメインコーパスで順番に学習、ドメインが近いデータを選別、独立に学習してアンサンブルを試している →単に連結して学習し、欲しいドメインでfine-tuneするのが一番よかった
Mixed Fine Tuning ドメイン外のデータで学習→ドメイン外+ドメイン内のデータでfine-tune
その他 Multilingual Multi-Domain Adaptation Approaches for Neural Machine Translation
ドメイン識別器を使う手法
Effective domain mixing for neural machine translation
ドメインベクトルをword embeddingに連結
関連論文