xuebinqin / U-2-Net

The code for our newly accepted paper in Pattern Recognition 2020: "U^2-Net: Going Deeper with Nested U-Structure for Salient Object Detection."
Apache License 2.0
8.52k stars 1.47k forks source link

模型训练时间过长 #361

Closed ZHIZIHUABU closed 1 year ago

ZHIZIHUABU commented 1 year ago

感谢作者十分优秀的工作!我需要把模型部署到嵌入式端,u2netp对我而言推理速度仍然较慢,我将网络层的filters参数减半,推理速度基本上能够满足要求。但是模型训练时难以收敛,模型裁剪前训练300epochs即可获取较好的性能,loss=0.99.8,裁剪后模型需要训练将近1000epochs loss才能降至同一水平。我推测是因为模型过小,在同样的数据集上拟合时间过长,如果随着数据集的进一步扩大,会有模型不收敛的情况出现吗?