Open xingchenshanyao opened 1 year ago
3.DarkNet结构 YOLOv3的作者在其论文中提出,他们调了一个对目标检测效果很好的网络结构,叫做DarkNet-53。其基本结构是Residual block,但是不同于ResNet中的Basic block和BottleNeck,这个Residual block采用1x1卷积接着一组3x3卷积,比bottleneck少了后面的1x1卷积层。该block中的3x3 filter的数量是1x1的两倍。整体网络结构,如下图:
4.CSPDarknet53 网络结构图如下: 注意:YOLO V4使用时删去了最后的池化层、全连接层以及Softmax层 CSP-DarkNet和CSP-ResNe(X)t的整体思路是差不多的,沿用网络的滤波器尺寸和整体结构,在每组Residual block加上一个Cross Stage Partial结构。并且,CSP-DarkNet中也取消了Bottleneck的结构,减少了参数使其更容易训练。
作者参考了一些源码以及darknet配置文件中的网络参数,得到的结构是这样的:
CSPDarkNet
参考来源:
主要讨论YOLOv4中的backbone(特征提取网络)——CSP-DarkNet,以及其实现的所必需的Mish激活函数,CSP结构和DarkNet。
1.1 softplus激活函数 上图是其输出曲线,softplus和ReLU的曲线具有相似性,但是其比ReLU更为平滑。 1.2 tanh激活函数 1.3 Mish激活函数 上图为Mish的曲线。首先其和ReLU一样,都是无正向边界的,可以避免梯度饱和;其次Mish函数是处处光滑的,并且在绝对值较小的负值区域允许一些负值。