Open liu1037342030 opened 2 months ago
忘了说,我并未使用1/4数据集,我使用的all训练数据集
哈喽~感谢你的报告。以下是我认为可能影响的点: @liu1037342030
可以考虑1/4 数据训练 用cutmix 然后学习率缩减为0.5倍看下效果
您好,非常感谢您的回复!我训练了所以的数据集,对于学习率的使用,我调整为和原论文一样,我在验证集的mIoU可以达到65.6,但是我在test集的(上传到网站上)mIoU仅有58.1,一开始以为是代码的问题,后面在您给出的权重上test得到61.8mIoU,表明代码似乎是没有问题的,这让我感到无奈,非常期待和您就这一问题进行讨论
通常来说 test和val有2 miou的gap是正常的 你这个gap确实有点大了 有可能是step lr的影响 可以尝试2st 3rd best 的model测试下 也可能是一些过拟合的问题 如果我我那个预训练模型test是61.8的话 说明你写的test代码应该没啥大问题 不过可能也检查下吧 😢
您好,我使用您的这组超参数训练所有的训练集,您有什么好的学习率调整建议吗,非常感谢!目前的情况是验证集效果为65,测试集在评估网站上仅58
感谢您优秀的工作!我首先下载了您提供的预训练权重进行了验证并很好的达到了和您一样的效果,然后我尝试进行了重新训练,但是结果并未达到您给出的预训练权重一样的精度,我使用了wce_two_stage配置,设备是一张4090,batchsize为6,我的精度如下:0.6021805,使用了TTA精度提升至0.6215877,这让我有些苦恼,请问在训练的时候还有什么需要注意的吗,感谢您的回复,谢谢