kuangliu / pytorch-cifar

95.47% on CIFAR10 with PyTorch
MIT License
5.94k stars 2.14k forks source link

ResNet #107

Open iwanggp opened 4 years ago

iwanggp commented 4 years ago

ResNet的第一层的卷积核应该为7x7的吧,你这实现怎么为3x3的了?

forwardwfg commented 4 years ago

应该是为了使用32x32,所以修改了一些参数

ww-zwj commented 4 years ago

这是cifar-10, 俩种选择,要么3232上采样为224,要么把第一层77改3*3,作者实现的各个网络都很精炼有效。

densechen commented 4 years ago

我想问一下,你们训练出来的精度,和作者readme里面给的精度比起来吻合吗? 我训练出来的精度普遍高了1-1.5个百分点

ww-zwj commented 4 years ago

我想问一下,你们训练出来的精度,和作者readme里面给的精度比起来吻合吗? 我训练出来的精度普遍高了1-1.5个百分点

除了efficientnet无法复原文献精度,其余均可。高1.5正常,作者的精度仅供参考。

densechen commented 4 years ago

@ww-zwj 谢谢!

lihuikenny commented 3 years ago

我想问一下,你们训练出来的精度,和作者readme里面给的精度比起来吻合吗? 我训练出来的精度普遍高了1-1.5个百分点

除了efficientnet无法复原文献精度,其余均可。高1.5正常,作者的精度仅供参考。

直接调用作者代码,改了一下batch,和作者精度差不多,我用分布式训练,采样和作者相同的预处理方式还有模型【resnet50】,精度差10个点左右,自己的resnet50【几乎和原版resnet50一样的结构】也只有83%左右,不知道是不是分布式代码写错了,还是其他原因?,

aoller-Jr commented 2 years ago

我想问一下,你们训练出来的精度,和作者readme里面给的精度比起来吻合吗? 我训练出来的精度普遍高了1-1.5个百分点

除了efficientnet无法复原文献精度,其余均可。高1.5正常,作者的精度仅供参考。

直接调用作者代码,改了一下batch,和作者精度差不多,我用分布式训练,采样和作者相同的预处理方式还有模型【resnet50】,精度差10个点左右,自己的resnet50【几乎和原版resnet50一样的结构】也只有83%左右,不知道是不是分布式代码写错了,还是其他原因?,

我也有类似的问题请问解决了吗?

lihuikenny commented 2 years ago

我想问一下,你们训练出来的精度,和作者readme里面给的精度比起来吻合吗? 我训练出来的精度普遍高了1-1.5个百分点

除了efficientnet无法复原文献精度,其余均可。高1.5正常,作者的精度仅供参考。

直接调用作者代码,改了一下batch,和作者精度差不多,我用分布式训练,采样和作者相同的预处理方式还有模型【resnet50】,精度差10个点左右,自己的resnet50【几乎和原版resnet50一样的结构】也只有83%左右,不知道是不是分布式代码写错了,还是其他原因?,

我也有类似的问题请问解决了吗?

很久了,我记得解决了,,最终我分布式的训练比作者的还高0点几个点,具体啥原因我忘了。好像是作者的resnet不一样