Closed Gs928 closed 3 years ago
我也采用了batchsize=4进行训练,但是最终指标只达到了11.50%左右,有什么别的训练tricks吗
是用的我的源代码吗?不经过任何改动那种
是的,使用的完全是源代码。最新的训练结果大概在10.5%左右。和源码不同的是batchsize=4是使用了4张显卡,一张显卡上一个batch
batchsize=4是使用了4张显卡,一张显卡上一个batch 这个是不行的,我这个对应的论文里有实验报告
好的,谢谢
我也采用了batchsize=4进行训练,但是最终指标只达到了11.50%左右,有什么别的训练tricks吗