Closed Eorsion closed 2 years ago
你好,感谢对我们工作的关注。我们采用的是DDP训练,使用4个GPU,每一个上面batch size是4,所以总体batch size是16。我之前没有试过更小的batch size,减小可能会对性能有影响。如果在同等条件下,你的改进提高了性能,那应该说明你的改进是有效的。
谢谢作者的回复,我现在遇到一个问题,就是代码跑不到论文中的准确率,虽然加了创新点后确实提升了,但是仍没有达到90.6%,我不知道这样算不算创新。
这是来自QQ邮箱的假期自动回复邮件。你好,我最近正在休假中,无法亲自回复你的邮件。我将在假期结束后,尽快给你回复。
作者你好,我阅读了您的文章,很受启发,并在GPU上复现了一下您的代码,发现代码中的batch_size=4,而论文里的batch_size=16,这个对准确率有影响吗