HikariTJU / LD

Localization Distillation for Object Detection (CVPR 2022, TPAMI 2023)
Apache License 2.0
355 stars 51 forks source link

How can I train my own VOC datasets? #36

Open Audrey528 opened 2 years ago

Audrey528 commented 2 years ago

我想尝试你们的方法在我自己数据集的效果,但是我遇到了很多问题。 1、我自己的数据集只有两类,不能使用提供的预训练模型 2、我想使用gfl_r101_fpn_voc.py重新训练一个教师网络,遇到错误如下所示。 1652337053(1) 另外,add new datasets的链接是失效的。感谢解答!

HikariTJU commented 2 years ago

1.这是一个bug,最新版已经修复了。 2.add new datasets 应该在 url

Audrey528 commented 2 years ago

我昨天pull的代码,存在上述问题

HikariTJU commented 2 years ago

image 732行已经被注释掉了,但是在你的图片里显示报错

Audrey528 commented 2 years ago

我修改了,之前报错如下,所以我去掉了注释。 微信图片_20220512164422

HikariTJU commented 2 years ago

我提交了一个新的commit,你试下有没有修好

Audrey528 commented 2 years ago

@HikariTJU 之前的问题解决了。 在训练完一轮后,推理出现如下错误,希望您给我些建议。 WeChat Image_20220513113044

HikariTJU commented 2 years ago

更新了,这下应该没问题

Audrey528 commented 2 years ago

@HikariTJU 感谢您的及时解决,上面问题解决了。我使用ld_r18_gflv1_r101_fpn_voc_1x.py训练蒸馏的学生网络,我修改了其中的参数,但是遇到了下面的问题。如果您能解决,能否告诉我您修改了哪个文件,以便我修改对应的文件,非常感谢。 WeChat Image_20220513232440

HikariTJU commented 2 years ago

修好了

Audrey528 commented 2 years ago

ld_r18_gflv1_r101_fpn_voc_1x.py训练蒸馏的学生网络,遇到了别的问题,如下所示 1652671615(1)

HikariTJU commented 2 years ago

cfg的bbox_head里加一条: loss_im=dict(type='IMLoss', loss_weight=0),

Audrey528 commented 2 years ago

感谢您的回答,问题解决了。 我问您两个问题。 1、loss_kd_neg和loss_im代表的含义是什么?在我训练过程中都是0 WeChat Image_20220516142141 2、训练完一轮的结果,出现这种原因是什么?我训练两类,一类的预测框数量为0 WeChat Image_20220516142213

HikariTJU commented 2 years ago

loss_kd_neg : loss vlr kd loss_im : loss imitation 特征图模仿损失 我建议你先把loss_kd关了训,看样子权重没调好,loss_kd损失值太高了。 顺便问一下,你baseline和教师的ap是多少?

Audrey528 commented 2 years ago

1、先把loss_kd关了训,您的意思是把分类头的蒸馏关掉吗? 2、我教师网络用的是resnet101+fpn+gfl,AP50是0.997,AP95是0.79;学生网络用的是resnet18+fpn+gfl,AP50是0.991,AP95是0.61。Generalized Focal Loss涨点效果太好了吧。但是backbone差别挺大的,这种结果是正常的吗?

HikariTJU commented 2 years ago
  1. 意思是loss_kd 权重设置为0
  2. backbone差别挺大是什么意思?
  3. 我问个问题:都99了为啥还要蒸馏?
Audrey528 commented 2 years ago

1.这里在加上loss_kd吗 1652711958(1) 2.resnet101和resnet18的网络深度差别挺大的 3.我是想先在一个小数据集上尝试使用这个方法,再用到大数据集上