Closed Arios-29 closed 2 years ago
同学你好,感谢你对我们工作的关注。
请问你用的tf版本和显卡型号是什么?或者是不是某些参数比如学习率的影响?我好来debug一下。
同学你好,感谢你对我们工作的关注。
请问你用的tf版本和显卡型号是什么?或者是不是某些参数比如学习率的影响?我好来debug一下。
我在实验室的Sophia服务器上也复现了这个问题 tensorflow版本是1.12.0 显卡型号是3*3090+2*RTX Titan,就是直接用
python main_from_args.py ./args/mtranse_args_15K.json EN_FR_15K_V1 721_5fold/1/
运行的。
也是到epoch 100就报错退出了
同学你好,感谢你对我们工作的关注。
请问你用的tf版本和显卡型号是什么?或者是不是某些参数比如学习率的影响?我好来debug一下。 tf版本为1.12.0 显卡为3090 学习率都是按照默认的,也是直接运行python main_from_args.py ./args/mtranse_args_15K.json EN_FR_15K_V1 721_5fold/1/,在epoch=100的时候出现ValueError
显卡问题,更换显卡型号就可以解决。
使用MTranse跑EN-FR-15K-V1,为什么会出现这么大的loss?