PaddlePaddle / models

Officially maintained, supported by PaddlePaddle, including CV, NLP, Speech, Rec, TS, big models and so on.
Apache License 2.0
6.9k stars 2.91k forks source link

seq2seq模型翻译效果问题 #4583

Open ghost opened 4 years ago

ghost commented 4 years ago

我用了官方文档-经典案例-自然语言处理-机器翻译-seq2seq模型(单一的seq2seq.py文件),换成了自己的数据集: ‘’‘ 中英语句对25w条,中文词典9w+,英文词典8w+,训练70个轮次左右,loss值在3.7左右浮动 ‘’’ 然而,中译英效果并不好,最多只能翻译一个句子里的几个词。请问是数据集的问题还是模型的问题,还是说这个训练得要好久,loss值要收敛到多少模型才基本可用?

guoshengCS commented 4 years ago

官方文档-经典案例-自然语言处理-机器翻译-seq2seq模型(单一的seq2seq.py文件)

那个只是作为一个示例使用的,模型相对简单一些效果会差一些,可以试下models中的Transformer模型 https://github.com/PaddlePaddle/models/tree/develop/PaddleNLP/machine_translation/transformer