-
## detail | 详细描述 | 詳細な説明
新手刚用ncnn,在windows平台上编译,遇到几个问题,麻烦答疑下,谢谢!
1. 编译了纯cpu版本和vulkan版本,读取摄像头画面跑的scrfd模型,cpu版本总体比vulkan版本的执行速度要快,这个可能是什么情况导致的?编译vulkan的时候怎么看是用的核显还是独显?
2. fp16比fp32慢,这个正常吗?
-
在PC端和移动端都基于ncnn推理,以及移动端基于TFlite-GPU推理,Flops相近的两个模型 yolov5n-0.5 和 SCRFD-0.5GF(Arxiv21),网络输入的图像数据的归一化分辨率也一样,但 yolov5n-0.5要慢很多。在一加5手机上基于TFlite-GPU,输入归一化分辨率640*480, yolov5n-0.5推理一次要100多ms,而 SCRFD-0.5GF(Ar…
-
cuda11.0
cudnn8.0.4.30
trt:8.0.34
opencv:3.4.2
cmake_minimum_required(VERSION 3.5)
project(pro)
option(CUDA_USE_STATIC_CUDA_RUNTIME OFF)
set(CMAKE_CXX_STANDARD 11)
set(CMAKE_CXX_STANDARD…
-
你好,非常感谢你的工作,受益匪浅。嗯,有个小问题,想咨询下你。你有没有做个一个程序里面启用2个乃至3个session的问题。比如,我可以把scrfd和plfd同时调用,实现更好的人脸检测和人脸关键点检测。但是,在这种情况下,两个session运行时间会远大于每次启用一个session的运行时间(比如,我单独测试scrfd或者pfld的时候,它们的运行时间分别为10ms和1ms,但是一个程序里面同时…
-
@Fanghc95 大佬你好,就是我是一名大二学生,然后是在中北大学的robomaster战队里负责用神经网络识别装甲板实现自动瞄准,不过就是之前我用yolo系列训练出来的模型最后实际测试时得到的bbox和装甲板的轮廓并不能很好的拟合,导致后续使用pnp进行姿态解算时会有较大误差,所以我想将传统yolo的数据集格式改为用四个角点的归一化坐标,然后我看到了您这个项目,我觉得我们的应用场景和车牌检测有…
-
Seems face boxes running on MacBook just need about 8ms
-
https://github.com/deepinsight/insightface/tree/master/detection/scrfd
一个综合性能非常好的人脸检测模型,建议能添加进来,目前Github上已有ncnn和onnx版本。
https://github.com/ppogg/onnx-scrfd-flask
https://github.com/nihui/ncnn-andro…
-
* add FaceBoxesV2 and PIPNet19, PIPNet29, PIPNet68, PIPNet98
-
Hi,
I compiled Tengine and my build install directory looks like:
```
dan@antec:~/Khadas/utils/Tengine-Lite/build/install$ tree
.
├── bin
│ ├── tm_classification
│ ├── tm_classification…
-
## Description
## Environment
**TensorRT Version**: 8.2GA
**NVIDIA GPU**: V100S
**NVIDIA Driver Version**: 470.57.02
**CUDA Version**: 11.4.2
**CUDNN Version**: 8.2
**Operating System**: ub…
Suke0 updated
2 years ago