Closed wujsAct closed 4 years ago
您好:
我完全按照手册上面的数据预处理和代码里原始的超参数进行训练,如题,拿wmt14 de-en数据集做为验证,打印训练过程中的验证集上面的bleu值大约3w步之后,就一直是0.31左右。跟手册上面显示3w步之后到达0.35左右相差很多。所以想知道手册上面的运行日志的实验选择的超参数是否跟公布的代码是否一样。
我的环境是python 3.6.9 + tensorflow 1.15.0。
期待您的回复。
@wujsAct 很抱歉没有及时回复! 手册中的结果跟使用的参数是一致的,但手册中使用的是wmt17的数据,跟wmt14的数据不一样,您可以换成wmt17的数据测试一下。
@GrittyChen 手册上面使用的validation set是newstest2014,因此log显示的应该也是在wmt14上面的结果。
@GrittyChen 我在wmt17 de-en上面测试结果是34.48。
您好:
我完全按照手册上面的数据预处理和代码里原始的超参数进行训练,如题,拿wmt14 de-en数据集做为验证,打印训练过程中的验证集上面的bleu值大约3w步之后,就一直是0.31左右。跟手册上面显示3w步之后到达0.35左右相差很多。所以想知道手册上面的运行日志的实验选择的超参数是否跟公布的代码是否一样。
我的环境是python 3.6.9 + tensorflow 1.15.0。
期待您的回复。