Closed XZLancer closed 3 years ago
请问推理的时候是用 TNNTest 运行还是自己写的 sdk? 这种运行正确无结果输出的情况可能是最后没有从 gpu 将数据取出到 cpu,可以检查一下 output_map 有没有数据转换
请问推理的时候是用 TNNTest 运行还是自己写的 sdk? 这种运行正确无结果输出的情况可能是最后没有从 gpu 将数据取出到 cpu,可以检查一下 output_map 有没有数据转换
@Maosquerade 使用自己写的sdk,最后得到结果使用了GetOutputMat并指定DeviceType为DEVICE_NAIVE,但是得到的mat->GetData()中数据全为0。output_map的数据转换指的是这个吗?
对的,应该从 getOutputMat 里拿到的数据是 cpu 的,结果为0比较奇怪。 请问方便贴一下 sdk 的代码吗?
那有可能是模型运行的问题,不知道是否方便发一份模型我们排查一下?
好的,onnx和tnn模型见下。 https://pan.baidu.com/s/1m7U7Cxz9F63Fhoy_rfu09g 提取码: 3e5s
你好,经测试该模型 CUDA 也是可以正常且结果对齐的,可以贴一下完整的 sdk 代码吗?包括输入输出的处理? 另外可以指定一下你编译 TNN 的 commit id,这边也方便在具体 commit 上测试一下
你好,可以尝试一下用 Forward 代替 ForwardAsync; 贴出来的代码看起来没有问题,可以尝试用 TNNTest 测试一下 CUDA 版本有无输出,如果有可以再检查一下 sdk 代码,如果没有可以检测一下 GPU 是否有问题。
TNNTest的输出如下。
F:\tnn\TNN\scripts\cuda_msvc_release\bin> .\TNNTest.exe -mp .\face_landmark.tnnproto -dt CUDA -wc 10
I/tnn: tnn::test::Timer::Print [File F:\tnn\TNN\test\timer.cc][Line 60] .\face_landmark.tnnproto - CUDA
TNN Benchmark time cost: min = 0.804 ms | max = 0.804 ms | avg = 0.804 ms
尝试过使用Forward,输出仍然是0 想问下您使用的CUDA、cudnn以及TensorRT版本是什么?
TNNTest 用 -op 可指定查看输出结果,看看是不是也是 0 我们测试的环境和你一样,是 CUDA 11.0 cudnn 8.0.5 及 TensorRT 7.1.3.4
确实全为0。这个维度是否算错了?应该只有62个输出值
1
255 mat_type: 32 dims: 2 1 62
0.000000
0.000000
0.000000
0.000000
0.000000
0.000000
0.000000
0.000000
0.000000
0.000000
0.000000
0.000000
0.000000
0.000000
0.000000
0.000000
0.000000
0.000000
0.000000
0.000000
0.000000
0.000000
0.000000
0.000000
0.000000
0.000000
0.000000
0.000000
0.000000
0.000000
0.000000
0.000000
0.000000
0.000000
0.000000
0.000000
0.000000
0.000000
0.000000
0.000000
0.000000
0.000000
0.000000
0.000000
0.000000
0.000000
0.000000
0.000000
0.000000
0.000000
0.000000
0.000000
0.000000
0.000000
0.000000
0.000000
0.000000
0.000000
0.000000
0.000000
0.000000
0.000000
这里维度是正确的,dims 第一个数是指 dimSize 感觉你可以检查一下显卡驱动,或者运行时检查一下 GPU 占用率和显存使用率。
运行时GPU显存占用是有在上升的,nvidia-smi下的process也有相应的进程。显卡驱动是最新的,重装了CUDA之后问题仍然存在
1. 环境(environment)
TensorRT Version: 7.1.3.4
2. 详细描述bug 情况 (Describe the bug) 在Windows端使用CUDA进行推理时,模型加载与数据输入都是正确的(Status == TNN_OK),但是模型的输出全为0。使用DEVICE_NAICE则可以得到正确输出。
6. 运行日志(runtime log)
2021-09-15 10:45:25.177 ( 2.734s) [ 3D17E185] inference_base.cc:128 INFO| input size: 43200 2021-09-15 10:45:25.178 ( 2.734s) [ 3D17E185] inference_base.cc:131 INFO| front: 2021-09-15 10:45:25.178 ( 2.734s) [ 3D17E185] inference_base.cc:133 INFO| -0.183594 2021-09-15 10:45:25.178 ( 2.735s) [ 3D17E185] inference_base.cc:133 INFO| -0.160156 2021-09-15 10:45:25.179 ( 2.735s) [ 3D17E185] inference_base.cc:133 INFO| -0.089844 2021-09-15 10:45:25.179 ( 2.736s) [ 3D17E185] inference_base.cc:133 INFO| -0.191406 2021-09-15 10:45:25.180 ( 2.736s) [ 3D17E185] inference_base.cc:133 INFO| -0.136719 2021-09-15 10:45:25.180 ( 2.736s) [ 3D17E185] inference_base.cc:133 INFO| -0.175781 2021-09-15 10:45:25.180 ( 2.737s) [ 3D17E185] inference_base.cc:133 INFO| -0.191406 2021-09-15 10:45:25.181 ( 2.737s) [ 3D17E185] inference_base.cc:133 INFO| -0.191406 2021-09-15 10:45:25.181 ( 2.737s) [ 3D17E185] inference_base.cc:133 INFO| -0.183594 2021-09-15 10:45:25.181 ( 2.738s) [ 3D17E185] inference_base.cc:133 INFO| -0.175781 2021-09-15 10:45:25.181 ( 2.738s) [ 3D17E185] inference_base.cc:133 INFO| -0.167969 2021-09-15 10:45:25.182 ( 2.738s) [ 3D17E185] inference_base.cc:133 INFO| -0.175781 2021-09-15 10:45:25.182 ( 2.738s) [ 3D17E185] inference_base.cc:133 INFO| -0.183594 2021-09-15 10:45:25.182 ( 2.738s) [ 3D17E185] inference_base.cc:133 INFO| -0.144531 2021-09-15 10:45:25.182 ( 2.738s) [ 3D17E185] inference_base.cc:133 INFO| -0.214844 2021-09-15 10:45:25.182 ( 2.739s) [ 3D17E185] inference_base.cc:133 INFO| -0.191406 2021-09-15 10:45:25.182 ( 2.739s) [ 3D17E185] inference_base.cc:133 INFO| -0.183594 2021-09-15 10:45:25.183 ( 2.739s) [ 3D17E185] inference_base.cc:133 INFO| -0.167969 2021-09-15 10:45:25.183 ( 2.739s) [ 3D17E185] inference_base.cc:133 INFO| -0.175781 2021-09-15 10:45:25.183 ( 2.739s) [ 3D17E185] inference_base.cc:133 INFO| -0.183594
2021-09-15 10:45:25.472 ( 3.028s) [ 3D17E185]inference_engine_tnn.cc:95 INFO| status: 1 2021-09-15 10:45:25.472 ( 3.029s) [ 3D17E185]inference_engine_tnn.cc:100 INFO| output is not null 2021-09-15 10:45:25.475 ( 3.031s) [ 3D17E185]inference_engine_tnn.cc:107 INFO| inference output total num: 62 2021-09-15 10:45:25.478 ( 3.034s) [ 3D17E185] inference_base.cc:144 INFO| output name: 255, data type: 0
2021-09-15 10:45:25.478 ( 3.034s) [ 3D17E185] inference_base.cc:147 INFO| output size: 62 2021-09-15 10:45:25.478 ( 3.034s) [ 3D17E185] inference_base.cc:150 INFO| front: 2021-09-15 10:45:25.478 ( 3.034s) [ 3D17E185] inference_base.cc:152 INFO| 0.000000 2021-09-15 10:45:25.478 ( 3.034s) [ 3D17E185] inference_base.cc:152 INFO| 0.000000 2021-09-15 10:45:25.478 ( 3.034s) [ 3D17E185] inference_base.cc:152 INFO| 0.000000 2021-09-15 10:45:25.478 ( 3.035s) [ 3D17E185] inference_base.cc:152 INFO| 0.000000 2021-09-15 10:45:25.478 ( 3.035s) [ 3D17E185] inference_base.cc:152 INFO| 0.000000 2021-09-15 10:45:25.478 ( 3.035s) [ 3D17E185] inference_base.cc:152 INFO| 0.000000 2021-09-15 10:45:25.478 ( 3.035s) [ 3D17E185] inference_base.cc:152 INFO| 0.000000 2021-09-15 10:45:25.478 ( 3.035s) [ 3D17E185] inference_base.cc:152 INFO| 0.000000 2021-09-15 10:45:25.479 ( 3.035s) [ 3D17E185] inference_base.cc:152 INFO| 0.000000 2021-09-15 10:45:25.479 ( 3.035s) [ 3D17E185] inference_base.cc:152 INFO| 0.000000 2021-09-15 10:45:25.479 ( 3.035s) [ 3D17E185] inference_base.cc:152 INFO| 0.000000 2021-09-15 10:45:25.479 ( 3.035s) [ 3D17E185] inference_base.cc:152 INFO| 0.000000 2021-09-15 10:45:25.479 ( 3.035s) [ 3D17E185] inference_base.cc:152 INFO| 0.000000 2021-09-15 10:45:25.479 ( 3.035s) [ 3D17E185] inference_base.cc:152 INFO| 0.000000 2021-09-15 10:45:25.479 ( 3.035s) [ 3D17E185] inference_base.cc:152 INFO| 0.000000 2021-09-15 10:45:25.479 ( 3.035s) [ 3D17E185] inference_base.cc:152 INFO| 0.000000 2021-09-15 10:45:25.479 ( 3.036s) [ 3D17E185] inference_base.cc:152 INFO| 0.000000 2021-09-15 10:45:25.479 ( 3.036s) [ 3D17E185] inference_base.cc:152 INFO| 0.000000 2021-09-15 10:45:25.479 ( 3.036s) [ 3D17E185] inference_base.cc:152 INFO| 0.000000 2021-09-15 10:45:25.479 ( 3.036s) [ 3D17E185] inference_base.cc:152 INFO| 0.000000
感谢答复