PaddlePaddle / Paddle-Lite

PaddlePaddle High Performance Deep Learning Inference Engine for Mobile and Edge (飞桨高性能深度学习端侧推理引擎)
https://www.paddlepaddle.org.cn/lite
Apache License 2.0
6.98k stars 1.61k forks source link

Error gpu 模型官方demo Failed! #9199

Closed 2050airobert closed 9 months ago

2050airobert commented 2 years ago

Hi 按照官方指示 在vim3 a311d G52MP4上运行demo程序, https://github.com/PaddlePaddle/Paddle-Lite-Demo/blob/develop/image_classification/android/shell/cxx/image_classification/README.md 发现异常如下: b6d406dea51b639366bd75a79fb3bbb

libpaddle_light_api_shared.so 采用的是最新develop ,编译命令如下 ./lite/tools/build_android.sh --arch=armv7 --toolchain=gcc --with_cv=ON --with_extra=ON --with_opencl=ON --with_log=ON 设置 use gpu = 1 运行命令如下, ./image_classification \ ./models/mobilenet_v1_for_gpu/model.nb \ ./images/tabby_cat.jpg \ ./labels/labels.txt \ 3 224 224 \ 3 4 10 0 1 \ 稍后把完整log 附上, log20220701-for-demo-debug-android-opencl.txt

麻烦大佬帮忙check下,多谢

paddle-bot-old[bot] commented 2 years ago

您好,我们已经收到了您的问题,会安排技术人员尽快解答您的问题,请耐心等待。请您再次检查是否提供了清晰的问题描述、复现代码、环境&版本、报错信息等。同时,您也可以通过查看官网文档常见问题历史Issue来寻求解答。祝您生活愉快~

Hi! We've received your issue and please be patient to get responded. We will arrange technicians to answer your questions as soon as possible. Please make sure that you have posted enough message to demo your request. You may also check out the APIFAQ and Github Issue to get the answer.Have a nice day!

sprouteer commented 2 years ago

这个跟平台的opencl 工作项限制有关,因为我们暂时没有这样的测试机,可以尝试打印和修改下lite/kernels/opencl/fc_image_compute.cc 中的316行和317行,global_worksize 和 local_worksize image

2050airobert commented 2 years ago

@sprouteer hi, 1 该修改为什么呢? 我只要先保证能跑通就行。 2 我记得当时你们改了一些参数,结果说跑mobilenet要1000ms以上,这个有点太夸张了,能否提供下最优参数,保证在100ms以内呢,mali g52MP4 gpu 性能还是不差的! 3 picodet XS 320 x 320 能提供下gpu 上的这个模型吗?

BR

sprouteer commented 2 years ago

之前的结论是local_work_size 不支持>32, 改为小于32可以跑通,但是性能差,性能差的问题还需要针对这个gpu进行特殊优化

2050airobert commented 2 years ago

1 是不是因为改为16后,就比官方支持的256 慢了16倍? 2 如果做针对的优化,会很麻烦吗? 还是基本上下周或月底就必定可以出来? 3 您还有什么问题或者需要我支持的信息吗?