使用的是IWSLT17中-英数据集,模型为Transformer,在训练过程中BLEU值一直在升高没有收敛,请问这是什么原因,与超参数的设置有关吗?
INFO:tensorflow:BLEU at step 10000: 0.110296INFO:tensorflow:BLEU at step 20000: 0.144964INFO:tensorflow:BLEU at step 30000: 0.178070INFO:tensorflow:BLEU at step 40000: 0.198967INFO:tensorflow:BLEU at step 50000: 0.222250INFO:tensorflow:BLEU at step 60000: 0.245278INFO:tensorflow:BLEU at step 70000: 0.266681INFO:tensorflow:BLEU at step 80000: 0.286975INFO:tensorflow:BLEU at step 90000: 0.308338INFO:tensorflow:BLEU at step 100000: 0.324188
`
使用的是IWSLT17中-英数据集,模型为Transformer,在训练过程中BLEU值一直在升高没有收敛,请问这是什么原因,与超参数的设置有关吗?
INFO:tensorflow:BLEU at step 10000: 0.110296
INFO:tensorflow:BLEU at step 20000: 0.144964
INFO:tensorflow:BLEU at step 30000: 0.178070
INFO:tensorflow:BLEU at step 40000: 0.198967
INFO:tensorflow:BLEU at step 50000: 0.222250
INFO:tensorflow:BLEU at step 60000: 0.245278
INFO:tensorflow:BLEU at step 70000: 0.266681
INFO:tensorflow:BLEU at step 80000: 0.286975
INFO:tensorflow:BLEU at step 90000: 0.308338
INFO:tensorflow:BLEU at step 100000: 0.324188
`初始参数设置如下:
--parameters=batch_size=2048,device_list=[0],train_steps=100000,eval_steps=2000,update_cycle=4
在测试集(newstest)上,只有11左右的BLEU值。