Zian-Xu / Swin-MAE

Pytorch implementation of Swin MAE https://arxiv.org/abs/2212.13805
62 stars 12 forks source link

求解:在MvTEC数据集训练400个epoch,重建效果依然很差 #5

Closed cestbonsuliu closed 1 year ago

cestbonsuliu commented 1 year ago

我MvTEC数据集的一个类别 cable 进行训练,样本数为223,然后案例如下

image

目录结构如下:

./datasets/MVTec/cable/train/good/...png  x223

训练的--data_path参数由此为./datasets/MVTec/cable/train

训练400个epoch之后,train_loss 为0.019,重建图片如下:

image

你好,这个怎么解决呢?

Zian-Xu commented 1 year ago

您好。 您的重建结果确实不理想。从目前您提供的信息看,我有两个建议: 一方面,目前网络的loss仍然较高,您需要改进网络的训练结果。可以尝试检查掩码后的输入图像是否符合预期(是否正确使用了window masking方法进行掩码,因为目前的重建结果中我没有观察到明显的patch之间的边界),loss函数有没有被正确的计算,或者尝试修改网络的超参数。还有考虑到您训练的样本数过少(223),可以尝试在训练过程中加入简单的数据增强,尽管MAE这类无监督学习方法并不依赖强数据增强,但是考虑到223例样本确实过少,训练400个epoch是很容易过拟合的。 另一方面,目前的重建不能说完全没效果,至少网络学习到了电缆的边界是圆形的,且里面有三个小圆形。这时您也可以尝试跑一下下游任务的迁移学习效果。毕竟并不是上游任务的重建结果越好,下游任务的迁移学习效果就越好。最终评价无监督学习的预训练效果,还是要参考下游任务的结果。 祝好。

------------------ 原始邮件 ------------------ 发件人: "Zian-Xu/Swin-MAE" @.>; 发送时间: 2023年6月30日(星期五) 下午4:59 @.>; @.***>; 主题: [Zian-Xu/Swin-MAE] 求解:在MvTEC数据集训练400个epoch,重建效果依然很差 (Issue #5)

我MvTEC数据集的一个类别 cable 进行训练,样本数为223,然后案例如下

目录结构如下: ./datasets/MVTec/cable/train/good/...png x223
训练的--data_path参数由此为./datasets/MVTec/cable/train

训练400个epoch之后,train_loss 为0.019,重建图片如下:

你好,这个怎么解决呢?

— Reply to this email directly, view it on GitHub, or unsubscribe. You are receiving this because you are subscribed to this thread.Message ID: @.***>

cestbonsuliu commented 1 year ago

好的,感谢回复,祝一切顺利!