Hanlard / PCL-Tongyan

通言模型是在M2M-100模型结构上进行改进的多语种机器翻译模型,通过参数复用和增量式训练,将模型参数从1.2B提升至13.2B,在一带一路多个小语种的翻译上大幅提升。
3 stars 0 forks source link

M2M-100 和 M2M-1.2B 的区别 #1

Open xptree opened 3 years ago

xptree commented 3 years ago

请问 M2M-100 和 M2M-1.2B 的主要区别是什么。是后者经过了 fine-tune 吗?

Hanlard commented 3 years ago

请问 M2M-100 和 M2M-1.2B 的主要区别是什么。是后者经过了 fine-tune 吗?

哦,是的,我们是在自己收集的一带一路语料上进行Finetune的,M2M-100是原始的1.2B模型测试的,M2M-1.2B(Finetune)是Finetune的