Open Sosuke115 opened 3 years ago
https://arxiv.org/abs/1702.01802
NMTで知識蒸留を行った論文
元の翻訳データと教師モデルによる翻訳データは両方使った方が良い
論文リンク
https://arxiv.org/abs/1702.01802
概要
NMTで知識蒸留を行った論文
手法のキモ
知見メモ
元の翻訳データと教師モデルによる翻訳データは両方使った方が良い