Open iwanggp opened 4 years ago
应该是为了使用32x32,所以修改了一些参数
这是cifar-10, 俩种选择,要么3232上采样为224,要么把第一层77改3*3,作者实现的各个网络都很精炼有效。
我想问一下,你们训练出来的精度,和作者readme里面给的精度比起来吻合吗? 我训练出来的精度普遍高了1-1.5个百分点
我想问一下,你们训练出来的精度,和作者readme里面给的精度比起来吻合吗? 我训练出来的精度普遍高了1-1.5个百分点
除了efficientnet无法复原文献精度,其余均可。高1.5正常,作者的精度仅供参考。
@ww-zwj 谢谢!
我想问一下,你们训练出来的精度,和作者readme里面给的精度比起来吻合吗? 我训练出来的精度普遍高了1-1.5个百分点
除了efficientnet无法复原文献精度,其余均可。高1.5正常,作者的精度仅供参考。
直接调用作者代码,改了一下batch,和作者精度差不多,我用分布式训练,采样和作者相同的预处理方式还有模型【resnet50】,精度差10个点左右,自己的resnet50【几乎和原版resnet50一样的结构】也只有83%左右,不知道是不是分布式代码写错了,还是其他原因?,
我想问一下,你们训练出来的精度,和作者readme里面给的精度比起来吻合吗? 我训练出来的精度普遍高了1-1.5个百分点
除了efficientnet无法复原文献精度,其余均可。高1.5正常,作者的精度仅供参考。
直接调用作者代码,改了一下batch,和作者精度差不多,我用分布式训练,采样和作者相同的预处理方式还有模型【resnet50】,精度差10个点左右,自己的resnet50【几乎和原版resnet50一样的结构】也只有83%左右,不知道是不是分布式代码写错了,还是其他原因?,
我也有类似的问题请问解决了吗?
我想问一下,你们训练出来的精度,和作者readme里面给的精度比起来吻合吗? 我训练出来的精度普遍高了1-1.5个百分点
除了efficientnet无法复原文献精度,其余均可。高1.5正常,作者的精度仅供参考。
直接调用作者代码,改了一下batch,和作者精度差不多,我用分布式训练,采样和作者相同的预处理方式还有模型【resnet50】,精度差10个点左右,自己的resnet50【几乎和原版resnet50一样的结构】也只有83%左右,不知道是不是分布式代码写错了,还是其他原因?,
我也有类似的问题请问解决了吗?
很久了,我记得解决了,,最终我分布式的训练比作者的还高0点几个点,具体啥原因我忘了。好像是作者的resnet不一样
ResNet的第一层的卷积核应该为7x7的吧,你这实现怎么为3x3的了?