The problem of depthwise_convolutional's version - Githubissues

hjimce / darknet_mobilenet

mobilenet 与darknet yolo

Other

94 stars 52 forks source link

The problem of depthwise_convolutional's version #10

Open jianghaijun007 opened 5 years ago

jianghaijun007 commented 5 years ago

在CSDN和github上找到的所有depthwise_convolutional_layer.c、depthwise_convolutional_layer.h、depthwise_convolutional_layer_kernels.cu都是支持darknet的yolov2版本，但和yolov3版本并不兼容，而且在多卡异步训练的时候，network_kernels.cu的好几个函数也要添加depth_convolutional参数相关的更新设置，故请问你有支持darknet yolov3版本的depthwise_convolutional_layer的c、h、cu代码吗？谢谢！

aimhabo commented 5 years ago

同一个问题，我用hjimce的版本跑是可以的（训练和测试），想移植到另一个版本里的时候，迭代第一次时看不出啥异常，第二次时就直接各项数值NaN了 https://github.com/hjimce/darknet_mobilenet/issues/2#issuecomment-449941917 @hjimce 请问除了和depthwise有关的函数和文件外，还有没有其他需要修改的地方？

Pattorio commented 5 years ago

同一个问题，我用hjimce的版本跑是可以的（训练和测试），想移植到另一个版本里的时候，迭代第一次时看不出啥异常，第二次时就直接各项数值NaN了 #2 (comment) @hjimce 请问除了和depthwise有关的函数和文件外，还有没有其他需要修改的地方？

请问你训练的时候会很很慢吗？我设置batch=128，跑一个iteration需要20+s，感觉很有问题

aimhabo commented 5 years ago

@Pattorio 挺快的，hjimce版mobileyolo2和pjreddie的yolov2速度差不多，没有记录具体时间，我是移植到AlexeyAB版里出问题

Pattorio commented 5 years ago

@aimhabo Thank you for your reply.

我直接git下来后make成功后跑，batch=128，GPU 1080Ti，CUDNN=1, GPU=1 OPENCV=1，每一个iteration要跑到30s左右，和你跑的比，是不是太慢了？而且精度很差，你的情况如何？下面是我的training-log

这是hjimce的关于darknet-mobilenet的一些改动，你可以看看。 https://blog.csdn.net/hjimce/article/details/76175802

aimhabo commented 5 years ago

@Pattorio 很有点... batch64的话多久呢？一般跑个几万iter才是有初步效果的

aimhabo commented 5 years ago

这些修改我都做了，看来问题在另一边，前/后向计算里可能AlexeyAB改过啥

WangDeyu commented 5 years ago

@jianghaijun007 具体有什么问题？我把yolov3中的卷积直接改成dw也可以正常使用,用的是官方hjimce版本没有network_kernel.cu,你用的是AlexeyAB版？

weilv9527 commented 3 years ago

这些修改我都做了，看来问题在另一边，前/后向计算里可能AlexeyAB改过啥

你好请问这个问题解决了吗我目前也是移植到AB中经过一个batch后各项数值就NAN 请问有解决办法吗谢谢

weilv9527 commented 3 years ago

@aimhabo 你好请问这个问题解决了吗我目前也是移植到AB中经过一个batch后各项数值就NAN 请问有解决办法吗谢谢