关于第一步稀疏化训练

talebolano / yolov3-network-slimming

yolov3 network slimming剪枝的一种实现

345 stars 93 forks source link

关于第一步稀疏化训练 #3

Open le8888e opened 5 years ago

le8888e commented 5 years ago

你好，请问你第一步稀疏化训练是直接在yolov3.weights的基础上finetune吗?这样稀疏化训练完后BN层的会有更多的y更接近0吗？因为我看原文都是从头开始训的，所以想问一下，谢谢

talebolano commented 5 years ago

并不会更接近0，但是我认为这是剪枝应该在实际工程应用中的用法，我目前在看https://arxiv.org/abs/1802.00124 这篇文章提出对bn层γ因子进行缩放，感觉是比较好的想法

le8888e commented 5 years ago

谢谢！我认为并不会更接近0是因为从yolov3.weights的基础上finetune,BN层的y不会跳出原来的最优解。如果对基网Darknet53在Imagenet上从头开始稀疏化训练，然后用这个Darknet53预训练模型来训yolov3，应该会有更多的y接近0.这样其实直接对原来的yolov3.weights进行剪枝就行了？并不需要第一步稀疏化的训练？

talebolano commented 5 years ago

直接剪枝会造成精度较大的损失（当然现在的剪枝也会造成很大的损失），而且在我的尝试中，直接剪枝会造成某些层被剪掉过多的channel，有时有route连接两个层时，会有一个层被直接剪掉