hjimce / darknet_mobilenet

mobilenet 与darknet yolo
Other
94 stars 52 forks source link

The problem of depthwise_convolutional's version #10

Open jianghaijun007 opened 5 years ago

jianghaijun007 commented 5 years ago

在CSDN和github上找到的所有depthwise_convolutional_layer.c、depthwise_convolutional_layer.h、depthwise_convolutional_layer_kernels.cu都是支持darknet的yolov2版本,但和yolov3版本并不兼容,而且在多卡异步训练的时候,network_kernels.cu的好几个函数也要添加depth_convolutional参数相关的更新设置,故请问你有支持darknet yolov3版本的depthwise_convolutional_layer的c、h、cu代码吗?谢谢!

aimhabo commented 5 years ago

同一个问题,我用hjimce的版本跑是可以的(训练和测试),想移植到另一个版本里的时候,迭代第一次时看不出啥异常,第二次时就直接各项数值NaN了 https://github.com/hjimce/darknet_mobilenet/issues/2#issuecomment-449941917 @hjimce 请问除了和depthwise有关的函数和文件外,还有没有其他需要修改的地方?

Pattorio commented 5 years ago

同一个问题,我用hjimce的版本跑是可以的(训练和测试),想移植到另一个版本里的时候,迭代第一次时看不出啥异常,第二次时就直接各项数值NaN了 #2 (comment) @hjimce 请问除了和depthwise有关的函数和文件外,还有没有其他需要修改的地方?

请问你训练的时候会很很慢吗?我设置batch=128,跑一个iteration需要20+s,感觉很有问题

aimhabo commented 5 years ago

@Pattorio 挺快的,hjimce版mobileyolo2和pjreddie的yolov2速度差不多,没有记录具体时间,我是移植到AlexeyAB版里出问题

Pattorio commented 5 years ago

@aimhabo Thank you for your reply.

我直接git下来后make成功后跑,batch=128,GPU 1080Ti,CUDNN=1, GPU=1 OPENCV=1,每一个iteration要跑到30s左右,和你跑的比,是不是太慢了?而且精度很差,你的情况如何?下面是我的training-log image

这是hjimce的关于darknet-mobilenet的一些改动,你可以看看。 https://blog.csdn.net/hjimce/article/details/76175802

aimhabo commented 5 years ago

@Pattorio 很有点... batch64的话多久呢?一般跑个几万iter才是有初步效果的

aimhabo commented 5 years ago

这些修改我都做了,看来问题在另一边,前/后向计算里可能AlexeyAB改过啥

WangDeyu commented 5 years ago

@jianghaijun007 具体有什么问题?我把yolov3中的卷积直接改成dw也可以正常使用,用的是官方hjimce版本没有network_kernel.cu,你用的是AlexeyAB版?

weilv9527 commented 3 years ago

这些修改我都做了,看来问题在另一边,前/后向计算里可能AlexeyAB改过啥

你好请问这个问题解决了吗 我目前也是移植到AB中 经过一个batch后各项数值就NAN 请问有解决办法吗谢谢

weilv9527 commented 3 years ago

@aimhabo 你好请问这个问题解决了吗 我目前也是移植到AB中 经过一个batch后各项数值就NAN 请问有解决办法吗谢谢