Mengqi Miao, Fandong Meng, Yijin Liu, Xiao-Hua Zhou, Jie Zhou

概要

NMTは流ちょうだが正しくない出力をしてしまうことがある。これは言語モデル(LM)が翻訳モデル(NMT)より強すぎるために起きる問題であるとし、NMT, LM間のマージンを定義。マージンに対する損失関数を追加することでこの問題に対応。訓練は2段階で行う。 BLEUスコアでよい結果を出した。

knok / arxiv-memo