Closed jnulzl closed 3 years ago
看下setCacheFile有没有生成cache文件,或者编译的时候开启MNN_OPENCL_PROFILE宏
看下setCacheFile有没有生成cache文件,或者编译的时候开启MNN_OPENCL_PROFILE宏
加了MNN_OPENCL_PROFILE后重新编译,MNNForwardType设置为MNN_FORWARD_OPENCL有如下输出,而设为MNN_FORWARD_CPU没有如下输出:
......
kernel cost:76 us Conv2D
kernel cost:25 us Raster0
kernel cost:215 us Raster1
kernel cost:13 us Softmax
kernel cost:11 us Unary
......
看起来MNNForwardType设置为MNN_FORWARD_OPENCL确实跑的是OPENCL,但是速度跟CPU的基本一样。
问题描述:
Win10 VS2019 16.9.3版本编译的MNN1.1.6
编译步骤参考这里
用GPU Caps Viewer查看的GPU信息如下: