Open lemon923 opened 6 years ago
您好,我最近用ResNet50-fpn在cityscape数据集上训练的时候总是出现梯度爆炸,然后loss出现nan,但是用ResNet50单分支就不会。想请教一下您对这个问题怎么看,这个是哪里出了问题呢。目前,把学习率设置为0.0001不会崩掉,但是训练结果不是很好。我看您的这个网络中,不同的层初始化权重还不一样,这个weight的初始化权重对网络是不是有很大影响呢,我尝试着去调了weight的初始化权重,但是没有出现很好的效果,请问有没有什么调节的技巧吗。
分析数据集物体尺寸,设计适合该数据集的anchor size.初始化策略不用改,lr可以减小。
anchor_size是按照maskrcnn里面的设置的。好的,我再仔细分析一下。非常感谢您。
您好,我最近用ResNet50-fpn在cityscape数据集上训练的时候总是出现梯度爆炸,然后loss出现nan,但是用ResNet50单分支就不会。想请教一下您对这个问题怎么看,这个是哪里出了问题呢。目前,把学习率设置为0.0001不会崩掉,但是训练结果不是很好。我看您的这个网络中,不同的层初始化权重还不一样,这个weight的初始化权重对网络是不是有很大影响呢,我尝试着去调了weight的初始化权重,但是没有出现很好的效果,请问有没有什么调节的技巧吗。