TNTWEN / OpenVINO-YOLOV4

This is implementation of YOLOv4,YOLOv4-relu,YOLOv4-tiny,YOLOv4-tiny-3l,Scaled-YOLOv4 and INT8 Quantization in OpenVINO2021.3
MIT License
238 stars 66 forks source link

Parsing YOLO Region output部分在嵌入式设备上耗时过长 #65

Open Chain-Mao opened 2 years ago

Chain-Mao commented 2 years ago

请问作者,Parsing YOLO Region output在树莓派上耗时达到65ms左右,严重干扰了实时检测效果,请问这部分是解析推理后的数据吗,有没有什么简化的方法呢?

Chain-Mao commented 2 years ago

image

TNTWEN commented 2 years ago

@maomao279 对,Parsing YOLO Region output是将神经网络的输出进行后处理,得到最终的检测框。 这个是挺难优化的。耗时的主要是NMS非极大值抑制,你可以看看有没有效率更高的NMS算法 。 另外C++的推理会比python快些。

Chain-Mao commented 2 years ago

@maomao279 对,Parsing YOLO Region output是将神经网络的输出进行后处理,得到最终的检测框。 这个是挺难优化的。耗时的主要是NMS非极大值抑制,你可以看看有没有效率更高的NMS算法 。 另外C++的推理会比python快些。

作者大哥,这个Parsing YOLO Region output貌似不包含NMS,是对图像划分为13×13个网格进行分析,单纯是循环次数太多13×13×3导致我耗时过大。在电脑CPU上处理还好,在嵌入式上就很慢了。