iamhankai / ghostnet.pytorch

[CVPR2020] GhostNet: More Features from Cheap Operations
https://arxiv.org/abs/1911.11907
522 stars 116 forks source link

ghostnet用于细粒度图像分类 #37

Open Javacr opened 4 years ago

Javacr commented 4 years ago

作者,你好!我最近将 带有预训练模型的 ghostnet1.0x 用于细粒度图像分类,数据集为cub_200,ghostnet只做了略微的调整,最后一层分类层的 num_classes=200。遇到一个问题,我用了SGD作为优化器,CLR作为学习率调整策略,拟合极快。10个epoch内,训练集准确率就到达了99.9%。23个epoch时,测试集达到了75%,并且之后不再上升。一直没想明白为何训练集拟合如此之快,以及测试集与训练集的acc的gap为何这么大。希望得到作者的指点。

Screenshot from 2020-06-14 09-11-35 Screenshot from 2020-06-14 09-16-18

iamhankai commented 4 years ago

你这个现象应该不是网络本身的问题,你换个网络也会有类似结果吧?可以尝试加大weight decay,多加一些data augmentation来缓解过拟合。

iamhankai commented 4 years ago

此外,我之前有做过细粒度图像分类,其中采用的attention机制以及实验设定供参考:https://arxiv.org/abs/1901.00392

Javacr commented 4 years ago

此外,我之前有做过细粒度图像分类,其中采用的attention机制以及实验设定供参考:https://arxiv.org/abs/1901.00392

大佬涉及方方面面,佩服。ghostnet的确好用,快而准。同时,谢谢大佬提供的论文链接,这两天我研究研究。