Closed xiulianzw closed 2 years ago
我的也是,请问你解决了嘛?
CPU版本的能用,或者你用之前版本的,装1.8.5也能用,估计是最新版的一个bug吧 @duohaoxue
InvalidArgumentError: The input tensor's dimension should be equal to the axis's size. But received input tensor's dimension is 4, axis's size is 3 [Hint: Expected x_rank == axis_size, but received x_rank:4 != axis_size:3.] (at /paddle/paddle/fluid/operators/transpose_op.cc:47) [Hint: If you need C++ stacktraces for debugging, please set
FLAGS_call_stack_level=2.]
我也有同样的问题, 加了这个命令 --use_gpu=False 出现以上error
@xiulianzw cuda和cudnn环境是啥,跑的动态图版本吗
你装了CPU版本的么? @yxd117
GPU版本的,CPU版本我测过没问题 @WenmuZhou
你装了CPU版本的么? @yxd117 GPU 版本的 '2.0.0-rc1' 应该是同样的问题
我也是报这个错误,你解决了吗?
你输出一下你paddlepaddle-gpu的安装信息,看看cudnn的版本是不是7.6.5的。 @YY007H
你输出一下你paddlepaddle-gpu的安装信息,看看cudnn的版本是不是7.6.5的。 @YY007H
多谢兄弟 我把我的cudnn从8.0.5 downgrade成7.6.5就没有这个error
我把cuda升级到11.0,cudnn升级到8.0,然后可以了。。。
我的cuda10.2 + cudnn8.0.5 不行 cuda10.2 + cudnn 7.6.5 没问题 不知道是不是我cuda8哪里装错了
@YY007H 我cuda11.0 cudnn8.0 不行 请问你操作系统是多少
@YY007H 我cuda11.0 cudnn8.0 不行 请问你操作系统是多少
我用的ubuntu20.04,python是3.8版本的
0 paddle::framework::SignalHandle(char const*, int) 1 paddle::platform::GetCurrentTraceBackString[abi:cxx11]()
FatalError: Segmentation fault
is detected by the operating system.
[TimeInfo: Aborted at 1611540174 (unix time) try "date -d @1611540174" if you are using GNU date ]
[SignalInfo: SIGSEGV (@0x0) received by PID 3564 (TID 0x7f8c1e82f740) from PID 0 ] 再搞不定 估计要重装系统了
@YY007H 我是centos7.9的 服务器显卡驱动版本是 11.2的 我不知道是不是驱动问题 这个问题bug搞了 几天了 一个老的服务器 cuda10.2 cudnn7.6 就没问题 这错不知道还有没有其他办法 C++ Traceback (most recent call last):
0 paddle::framework::SignalHandle(char const*, int) 1 paddle::platform::GetCurrentTraceBackStringabi:cxx11
Error Message Summary:
FatalError:
Segmentation fault
is detected by the operating system. [TimeInfo: Aborted at 1611540174 (unix time) try "date -d @1611540174" if you are using GNU date ] [SignalInfo: SIGSEGV (@0x0) received by PID 3564 (TID 0x7f8c1e82f740) from PID 0 ] 再搞不定 估计要重装系统了
我没记错的话,centos7.9不能装这么高的版本,你需要降级
I am also getting similar error for below version:
W0217 12:22:39.872664 1972 device_context.cc:362] Please NOTE: device: 0, GPU Compute Capability: 7.5, Driver API Version: 11.2, Runtime API Version: 10.2
W0217 12:22:40.391552 1972 device_context.cc:372] device: 0, cuDNN Version: 8.1.
--------------------------------------
C++ Traceback (most recent call last):
--------------------------------------
0 paddle::framework::SignalHandle(char const*, int)
1 paddle::platform::GetCurrentTraceBackString[abi:cxx11]()
----------------------
Error Message Summary:
----------------------
FatalError: `Segmentation fault` is detected by the operating system.
[TimeInfo: *** Aborted at 1613564641 (unix time) try "date -d @1613564641" if you are using GNU date ***]
[SignalInfo: *** SIGSEGV (@0x0) received by PID 1972 (TID 0x7f344ad72740) from PID 0 ***]
Segmentation fault (core dumped)
是cudnn版本的问题,换成7.5的试试看吧?我后面也是换了cudnn的版本就没问题了
I am running in google cloud vm instance. So I am not sure if can change the Cudnn version..
你现在用的是2.0.0稳定版本吗?我之前用的是2.0rc1版本的,也许官方已经在稳定版上修正了。如果是Google云,不知道能不能安装cuda,如果可以的话,你就自己再安装一下cuda和cudnn吧,然后在~/.bashrc配置一下。如果只是部署项目,可以考虑直接使用docker镜像。
I am not deploying . I am trying to train the model. With CPU, everything works fine. Any idea how long the training of images take with CPU ?
cuda 10.2 + libcudnn 7.6.5.32 可以工作
我也遇到同样的问题,cuda 10.2 + libcudnn 8, 请问大佬们怎么解决的
So, paddlepaddle-ocr supports 10.2 cuda with 7.6.5 cudnn
测试是cuda和cudnn搭配的paddlepaddle不匹配。 https://www.paddlepaddle.org.cn/install/quick?docurl=/documentation/docs/zh/install/pip/windows-pip.html#cuda10.2
安装对应的paddlepaddle 就好了
我的cuda10.2 + cudnn8.0.5 不行 cuda10.2 + cudnn 7.6.5 没问题 不知道是不是我cuda8哪里装错了
cuda10.2 + cudnn 7.6.5 还是报错
我的cuda10.2 + cudnn8.0.5 不行 cuda10.2 + cudnn 7.6.5 没问题 不知道是不是我cuda8哪里装错了
cuda10.2 + cudnn 7.6.5 还是报错
应该就是cuda和cudnn版本配合的问题,可以换几种组合试试
FatalError: `Segmentation fault` is detected by the operating system.
[TimeInfo: *** Aborted at 1628103340 (unix time) try "date -d @1628103340" if you are using GNU date ***]
[SignalInfo: *** SIGSEGV (@0x58564a3239) received by PID 721 (TID 0x7f7e29429780) from PID 1447703097 ***]
I had same this problems. How to fix this ? I use command:
!python3 tools/infer_det.py -c configs/det/det_r50_vd_east.yml -o Global.infer_img=$public_dataset_dir \
Global.pretrained_model="/content/drive/My Drive/Colab_Notebook/text_scence_detection/PaddleOCR/output/det_r50_vd_east_v2.0_train/best_accuracy"
cudnn和cuda版本的问题吧
FatalError: `Segmentation fault` is detected by the operating system. [TimeInfo: *** Aborted at 1628103340 (unix time) try "date -d @1628103340" if you are using GNU date ***] [SignalInfo: *** SIGSEGV (@0x58564a3239) received by PID 721 (TID 0x7f7e29429780) from PID 1447703097 ***]
I had same this problems. How to fix this ? I use command:
!python3 tools/infer_det.py -c configs/det/det_r50_vd_east.yml -o Global.infer_img=$public_dataset_dir \ Global.pretrained_model="/content/drive/My Drive/Colab_Notebook/text_scence_detection/PaddleOCR/output/det_r50_vd_east_v2.0_train/best_accuracy"
我把cuda升级到11.0,cudnn升级到8.0,然后可以了。。。 你好我的就是这个环境 但是还是这个错误
cuda11,cudnn8.0安装paddlepaddle-gpu==2.0.0会出现上述问题,把paddlepaddle-gpu包参考官网的教程安装成2.2.1版本没有问题。
# https://www.paddlepaddle.org.cn/install/quick?docurl=/documentation/docs/zh/install/pip/linux-pip.html
python -m pip install paddlepaddle-gpu==2.2.1.post110 -f https://www.paddlepaddle.org.cn/whl/linux/mkl/avx/stable.html
Since you haven\'t replied for more than 3 months, we have closed this issue/pr. If the problem is not solved or there is a follow-up one, please reopen it at any time and we will continue to follow up. It is recommended to pull and try the latest code first. 由于您超过三个月未回复,我们将关闭这个issue/pr。 若问题未解决或有后续问题,请随时重新打开(建议先拉取最新代码进行尝试),我们会继续跟进。
我的docker环境cuda11.3,cudnn8.2装paddlepaddle==2.3.0也有这个问题,用下面的命令重新安装解决了。 python -m pip install paddlepaddle-gpu==2.2.1.post112 -f https://www.paddlepaddle.org.cn/whl/linux/mkl/avx/stable.html
一定要按照这个链接里的https://www.paddlepaddle.org.cn/install/quick?docurl=/documentation/docs/zh/install/pip/windows-pip.html#cuda10.2里的 GPU版的PaddlePaddle 板块 针对不同版本的cuda下载paddlepaddle。不然pip命令默认安装的是cuda 10.2版本的!
用的git上的最新版的PaddleOCR,在执行python tools/infer/predict_system.py报错,错误信息如下:
执行paddle.utils.run_check()的信息如下:
环境信息: python版本3.8.5,3.7的也测试过一样的错误
用之前的版本,安装1.8.5的测试没有问题