Open wangqiangneu opened 4 years ago
更好的model ensemble方法,前提是需要提前知道test set的源语数据,因此适合offline translation(e.g. WMT),不适合online translation。这里提到的transductive learning是semi-supervised learning的特例,这里的semi-supervised体现在单语数据不是用来做training set(e.g. back-translation),而是用validation/test set的单语数据!希望之前在training set训的模型能适应test set的空间。所以基本方法是:让多个训好的模型,翻译valid/test中的源语数据,形成伪数据。用这个伪数据(可选:混部分训练数据,但是效果不明显)finetune之前的多个模型。用valid从这些finetuned好的模型中做模型选择。最终只使用一个finetuned single model翻译test set
transductive learning
semi-supervised learning
semi-supervised
back-translation
简介
更好的model ensemble方法,前提是需要提前知道test set的源语数据,因此适合offline translation(e.g. WMT),不适合online translation。这里提到的
transductive learning
是semi-supervised learning
的特例,这里的semi-supervised
体现在单语数据不是用来做training set(e.g.back-translation
),而是用validation/test set的单语数据!希望之前在training set训的模型能适应test set的空间。所以基本方法是:让多个训好的模型,翻译valid/test中的源语数据,形成伪数据。用这个伪数据(可选:混部分训练数据,但是效果不明显)finetune之前的多个模型。用valid从这些finetuned好的模型中做模型选择。最终只使用一个finetuned single model翻译test set论文信息
总结