PaddlePaddle / Paddle

PArallel Distributed Deep LEarning: Machine Learning Framework from Industrial Practice (『飞桨』核心框架,深度学习&机器学习高性能单机、分布式训练和跨平台部署)
http://www.paddlepaddle.org/
Apache License 2.0
22.29k stars 5.62k forks source link

paddlepaddle3.0 安装后 import paddle 测试报错:Illegal instruction #68881

Open AZH1992 opened 1 month ago

AZH1992 commented 1 month ago

bug描述 Describe the Bug

用的python3 -m pip install paddlepaddle-gpu==3.0.0b1 -i https://www.paddlepaddle.org.cn/packages/stable/cu123/ 看了指令集支持avx nvidia-smi显示cuda12.4 nvcc -V显示cuda 12.3 cudnn 9.0

其他补充信息 Additional Supplementary Information

No response

AZH1992 commented 1 month ago

补充一下,之前paddlepaddle2.8的版本没问题

ronny1996 commented 1 month ago

你好,报错能贴一下吗

AZH1992 commented 1 month ago

亲,您好!您的来件已收到,谢谢!            ——艾志华

AZH1992 commented 1 month ago

报错就是python,然后输入import paddle换行就报错了 image

AZH1992 commented 1 month ago

你好,报错能贴一下吗

看上面的报错

ronny1996 commented 1 month ago

你好,看起来是cpu架构不匹配,请问用的是什么cpu和os?

AZH1992 commented 1 month ago

你好,看起来是cpu架构不匹配,请问用的是什么cpu和os? centos和gpu (NVIDIA GeForce GTX 1660 Ti)

ronny1996 commented 1 month ago

请问是什么cpu?

AZH1992 commented 1 month ago

你好,看起来是cpu架构不匹配,请问用的是什么cpu和os?

之前paddlepaddle2.6的时候是好的,后面我安装的paddle3.0报这个错,我就升级了cuda到12.3,重新安装还是报这个错,早上试了用paddle2.6的没报错,paddle3.0使用cuda11.8的那个版本,import paddle也没报错。

ronny1996 commented 1 month ago

这个问题我反馈一下,可以先使用 cuda11.8

AZH1992 commented 1 month ago

请问是什么cpu?

image

ronny1996 commented 1 month ago

image 驱动是否是满足cuda 12.3 的最低版本要求

AZH1992 commented 1 month ago

image 驱动是否是满足cuda 12.3 的最低版本要求

550.127.05 的,nvidia-smi显示cuda最高12.4,nvcc -V是12.3 刚刚上面cpu发错了,那个是我本机的。实际是 image

ronny1996 commented 1 month ago

你好,非mkl的paddle3.0 cuda12.3版本会报错吗?可能用到了不支持的avx512指令

AZH1992 commented 1 month ago

这个问题我反馈一下,可以先使用 cuda11.8

换成11.8的报Device not found 1 from 0,1,2,3 for setting ['0']

你好,非mkl的paddle3.0 cuda12.3版本会报错吗?可能用到了不支持的avx512指令

这个没试过,目前用的cuda11.8的那个版本是可以的,avx512确实没有,有avx和avx2

ronny1996 commented 1 month ago

好的,可以先使用 cuda11.8

XieJJ99 commented 3 weeks ago

你好,非mkl的paddle3.0 cuda12.3版本会报错吗?可能用到了不支持的avx512指令

我的环境中也有这个问题,应该就是这个原因。你们应该检查一下是否有AVX512支持,如果没有应该回滚到AVX2。

soulocy commented 2 weeks ago

我也是装3.0报Illegal instruction,2.6没有问题,i714700kf + unbentu24 + 4070ti super + python3.12