shuxueslpi / chatGLM-6B-QLoRA

使用peft库,对chatGLM-6B/chatGLM2-6B实现4bit的QLoRA高效微调,并做lora model和base model的merge及4bit的量化(quantize)。
356 stars 46 forks source link

ImportError: libcudnn.so.8: cannot open shared object file: No such file or directory #36

Open Hzzhang-nlp opened 1 year ago

Hzzhang-nlp commented 1 year ago

image

shuxueslpi commented 1 year ago

cuda确定环境ok吗?import torch怎么就报错了?

Hzzhang-nlp commented 1 year ago

cuda确定环境ok吗?import torch怎么就报错了?

conda创建一个虚拟环境,然后进入克隆的你这个项目的仓库里pip install -r requirements.txt,然后再去运行训练代码就报了这个错,我其他两个虚拟环境的pytorch都没问题

shuxueslpi commented 1 year ago

你创建环境后,单独装一次pytorch,然后再装requirements里的依赖试试,你这个就是基础环境的问题,我还是建议用docker

Hzzhang-nlp commented 1 year ago

自己的台式机啊,怎么用docker?你那个requirements.txt应该把torch也放进去吧?

shuxueslpi commented 1 year ago

windows的台式机也可以装docker 默认你是有完整的torch-gpu环境的,这部分环境的搭建可能每个人都有细微差异,否则也运行不了transformers 最统一的方式就是从docker开始,屏蔽了很多基础环境问题

shuxueslpi commented 1 year ago

https://pytorch.org/get-started/locally/#start-locally 看下这里windows的安装命令

Hzzhang-nlp commented 1 year ago

https://pytorch.org/get-started/locally/#start-locally 看下这里windows的安装命令

安装我肯定会啊,我的意思是最好requirements.txt文件里把该包含的库都包含了,一键启动,开箱即用多方便

shuxueslpi commented 1 year ago

但torch的安装命令不是唯一的,所以我提供的开箱即用的环境是docker环境,即使是transformers官方也没有直接一键即用,也要先安装好torch,tensorflow或jax

Hzzhang-nlp commented 1 year ago

我台式机装的ubuntu系统,昨晚我直接安装requirements.txt后用pip list查看时有torch的,好的,我回去试试,先安装torch,再pip install -r requirements.txt

shuxueslpi commented 1 year ago

我也是台式机ubuntu,装的docker,更建议你用docker

Hzzhang-nlp commented 1 year ago

好的

Hzzhang-nlp commented 1 year ago

我也是台式机ubuntu,装的docker,更建议你用docker

环境没问题了,但是一加载模型,就被killed,3060的显存,还是没法直接加载ChatGLM-6B