wangqiangneu / MT-PaperReading

Record my paper reading about Machine Translation and other related works.
36 stars 2 forks source link

19-IWSLT-Multitask Learning For Different Subword Segmentations In Neural Machine Translation #26

Open wangqiangneu opened 5 years ago

wangqiangneu commented 5 years ago

简介

做token segmentation的。本来看题目觉得挺有意思,脑海中闪现很多想法,结果一看文章,感觉有点水呀。基本思路是,共享一个encoder,对于target language提供多个segmentation的方式(实际就是BPE的merge operation数不同),每一种segmentation的方式都有一个独立的decoder,然后一起训练,说是比单独训要好。最后每一种segmentation的结果可以用system combination的方式做个集成

论文信息

总结