Jetson nano基于Paddle-Inference-Demo GPU预测`Sync params from CPU to GPU`程序卡住不执行

PaddlePaddle / Paddle

PArallel Distributed Deep LEarning: Machine Learning Framework from Industrial Practice （『飞桨』核心框架，深度学习&机器学习高性能单机、分布式训练和跨平台部署）

http://www.paddlepaddle.org/

Apache License 2.0

22.3k stars 5.62k forks source link

Jetson nano基于Paddle-Inference-Demo GPU预测`Sync params from CPU to GPU`程序卡住不执行 #31767

Closed Irvingao closed 1 year ago

Irvingao commented 3 years ago

版本、环境信息： 1）PaddlePaddle版本：PaddlePaddle-gpu2.0.0 2）系统环境：Jetson nano Ubuntu18.04，python3.6.9
复现信息：如为报错，请给出复现环境、复现步骤
问题描述：请详细描述您的问题，同步贴出报错信息、日志/代码关键片段

执行Paddle-Inference-Demo/python/resnet50/run.sh，问题如下：

（1）GPU预测程序卡住不执行

（2）CPU预测正常

尝试了多个demo，均是这样。

paddle-bot-old[bot] commented 3 years ago

您好，我们已经收到了您的问题，会安排技术人员尽快解答您的问题，请耐心等待。请您再次检查是否提供了清晰的问题描述、复现代码、环境&版本、报错信息等。同时，您也可以通过查看官网API文档、常见问题、历史Issue、AI社区来寻求解答。祝您生活愉快～

Hi! We've received your issue and please be patient to get responded. We will arrange technicians to answer your questions as soon as possible. Please make sure that you have posted enough message to demo your request. You may also check out the API，FAQ，Github Issue and AI community to get the answer.Have a nice day!

cryoco commented 3 years ago

您好，感谢您的反馈，我们复现看下这个问题

Irvingao commented 3 years ago

yolov3执行也相同，cuda_linux使用GPU预测正常。

wangye707 commented 3 years ago

@Irvingao 你好，目前发现jetson在nano和tx2两款设备在开启GPU预测时会出现预测问题，经过我们测试，agx xavier, nx设备下，该模型可以正常预测，其中nx设备需要手动设置 config.enable_use_gpu(500, 0)。如果您有其他jetson设备，可以暂时先用其他的设备，我们会尽快定位修复这个问题。

Irvingao commented 3 years ago

@wangye707 你好，请问是否修复该问题？修复后能否在这里通知一下，感谢！

wangye707 commented 3 years ago

@Irvingao 暂时还没修复，修复后我来回复你

Irvingao commented 3 years ago

我在JetPack 4.4.1的版本上，agx xavier报错Segmentation fault：

Irvingao commented 3 years ago

@wangye707 请问修复了吗？

QQ39272490 commented 3 years ago

楼上的你的问题解决了吗？我也一直卡在这里用不了GPU

wangye707 commented 3 years ago

@Irvingao @QQ39272490 最新的V2.1.1版本已经修复了此问题。

QQ39272490 commented 3 years ago

@Irvingao 方便加你个QQ或微信吗？

QQ39272490 commented 3 years ago

@wangye707 有试过mobileNet吗？我用的MobileNewV1跟你以上的情况一样 https://github.com/PaddlePaddle/Paddle/issues/33910

wangye707 commented 3 years ago

@QQ39272490 我这边复现了一下，MobileNetV1、MobileNetV2、MobileNetV3系列均可以正常推理。jetson nano因为性能原因，可能需要swap内存。我这边swap了10G，官网链接：https://paddleinference.paddlepaddle.org.cn/user_guides/source_compile.html

QQ39272490 commented 3 years ago

@wangye707 感谢解答，可能是内存原因，一执行GPU我的GUI界面就提示内存低。

QQ39272490 commented 3 years ago

我用的是nano 2G 版本

Irvingao commented 3 years ago

@Irvingao @QQ39272490 最新的V2.1.1版本已经修复了此问题。我在安装成功了paddlepaddle2.1.1版本的whl后， python3import paddle报错：

QQ39272490 commented 3 years ago

你这安装的版本是不是不对呀

QQ39272490 commented 3 years ago

我用mobileNetV1跑起来了，GPU比CPU差不多提速6倍

Irvingao commented 3 years ago

这是我安装的版本：请问有什么问题呢？

Irvingao commented 3 years ago

@QQ39272490 我的nano 版本型号如下：

QQ39272490 commented 3 years ago

这版本也应该没有问题，我后面装的maxwell

Irvingao commented 3 years ago

@wangye707

Jetson nano环境配置和whl如上，请问这是什么问题呢？

Irvingao commented 3 years ago

上述问题已解决，同时完整部署流程和问题解决方式已记录为博客：https://blog.csdn.net/qq_45779334/article/details/118611953

PaddlePaddle / Paddle

Jetson nano基于Paddle-Inference-Demo GPU预测`Sync params from CPU to GPU`程序卡住不执行 #31767

执行Paddle-Inference-Demo/python/resnet50/run.sh，问题如下：

（1）GPU预测程序卡住不执行

（2）CPU预测正常

Jetson nano环境配置和whl如上，请问这是什么问题呢？

执行`Paddle-Inference-Demo/python/resnet50/run.sh`，问题如下：