wangqiangneu / MT-PaperReading

Record my paper reading about Machine Translation and other related works.
36 stars 2 forks source link

20-AAAI-Transductive Ensemble Learning for Neural Machine Translation #53

Open wangqiangneu opened 4 years ago

wangqiangneu commented 4 years ago

简介

更好的model ensemble方法,前提是需要提前知道test set的源语数据,因此适合offline translation(e.g. WMT),不适合online translation。这里提到的transductive learningsemi-supervised learning的特例,这里的semi-supervised体现在单语数据不是用来做training set(e.g. back-translation),而是用validation/test set的单语数据!希望之前在training set训的模型能适应test set的空间。所以基本方法是:让多个训好的模型,翻译valid/test中的源语数据,形成伪数据。用这个伪数据(可选:混部分训练数据,但是效果不明显)finetune之前的多个模型。用valid从这些finetuned好的模型中做模型选择。最终只使用一个finetuned single model翻译test set

论文信息

总结