leeyoshinari / YOLO_v2

The implementation of YOLO v2 with TensorFlow
GNU General Public License v3.0
80 stars 38 forks source link

想问一下 训练收敛不佳,并且有Nan的情况, #48

Open jks88990041 opened 2 years ago

jks88990041 commented 2 years ago

如何解决这个问题呢?可以有偿回答嘛

jks88990041 commented 2 years ago

调整学习率为 0.00001后 没有NaN情况了。 但是模型感觉从一开始loss就很小,后面一直就在反复横跳

leeyoshinari commented 2 years ago

迁移学习的话,模型已经基本训练好了,肯定会反复跳。可以尝试只恢复部分层的参数,然后适当调整学习速率,可以多看看论文里怎么设置的学习速率。

jks88990041 commented 2 years ago

好的谢谢大佬。 就有点不明白的地方就是,大佬你给的最佳参数 我测试图片的时候效果不是很好哎。还有就是这个NaN的问题,不知是不是网络结构有的地方有小问题, 导致梯度爆炸的情况。 = = 目前没找着阿我。

leeyoshinari commented 2 years ago

首先,我没说我给的是最佳参数;其次,梯度爆炸很正常,需要积累调参经验;最后,代码可能存在问题,你能找出来的话,欢迎告诉我一下

jks88990041 commented 2 years ago

好的大佬