Open wangqiangneu opened 4 years ago
把MNMT跟MASS结合一起了,在NMNT中引入单语数据(用MASS的方式)。方法很简单,双语数据用over-sampling缓解low-resource的数据不平衡(tempearture=5)。而单语数据则是所有语种uniform sampling,理由是单语数据分布并不过分倾斜于某些语种。而parallel data和monolingual data with self-supervision则是各占50%进行混合的
MNMT
MASS
over-sampling
uniform sampling
简介
把
MNMT
跟MASS
结合一起了,在NMNT中引入单语数据(用MASS
的方式)。方法很简单,双语数据用over-sampling
缓解low-resource的数据不平衡(tempearture=5)。而单语数据则是所有语种uniform sampling
,理由是单语数据分布并不过分倾斜于某些语种。而parallel data和monolingual data with self-supervision则是各占50%进行混合的有意思的点
论文信息
总结