Closed jrd77 closed 8 months ago
加环境变量 CUDA_LAUNCH_BLOCKING=1 再试下看看具体的报错信息
加环境变量 CUDA_LAUNCH_BLOCKING=1 再试下看看具体的报错信息
It seems your cuda runtime is not correctly installed.
请问你解决了吗,我也是A100 cuda11.8遇到这个问题,加环境变量 CUDA_LAUNCH_BLOCKING=1 后,还是不行 ![Uploading iShot_2024-01-24_08.23.03.png…]()
没解决,后续我直接使用huggingFace里面的GPTQ量化的模型,就没问题了,猜测可能是官方使用awq量化,我的显卡支持有问题 'TheBloke/Yi-34B-Chat-GPTQ', 'https://hf-mirror.com/TheBloke/SUS-Chat-34B-GPTQ' @wells-Qiang-Chen
6B模型运行成功,Yi-34B-Chat-4bits运行失败。
执行代码:
报错信息:
运行环境:
ubuntu 22,NVIDIA V100 32G,cuda11.8
micromamba list