bubbliiiing / yolo3-pytorch

这是一个yolo3-pytorch的源码,可以用于训练自己的模型。
MIT License
2.01k stars 585 forks source link

weight init的问题 #176

Open zhuasd opened 1 year ago

zhuasd commented 1 year ago

网络重新开始训练的时候初始化权重为何会出现Killed呢?在我使用top命令监控电脑,内存没有爆炸的时候,请问up主是什么原因呢? root@2f0cdf9ef68c:/home/zzg/yolo3-pytorch# python3 train.py initialize network with normal type Killed

zhuasd commented 1 year ago

排查出来是因为我加了transformerblock的原因

zhuasd commented 1 year ago

正在积极寻找初始化transformerblock的方法

bubbliiiing commented 1 year ago

感觉不太合理……那个初始化会影响你的transformerblock吗……

bubbliiiing commented 1 year ago

你直接把init去了,会随机初始化

zhuasd commented 1 year ago

目前来看,通过transformer修改backbone之后,weight_init并没有受影响。

zhuasd commented 1 year ago

up主,我在使用新的backbone(加了注意力模块)进行网络训练的时候,进行300epoch(数据集比较小的缘故)train,loss降到0.27左右就不动了,而原yolov3网络在300epoch下能降到0.23左右。按理说我改进了backbone,loss应该会进一步降低的,为什么出现这种情况呢?还有什么方法能进一步降低loss呢(目前能想到的就是改进neck部分)?

bubbliiiing commented 1 year ago

不是的,注意力机制不一定容易拟合

zhuasd commented 1 year ago

解决拟合问题是需要增加epoch吗?增加注意力机制后的YOLOv3和原YOLOv3网络训练的epoch数是一致的,如果单独增加添加注意力机制后的YOLOv3的epoch数是不是实验结果就不能对照了呢?