yuanzhoulvpi2017 / zero_nlp

中文nlp解决方案(大模型、数据、模型、训练、推理)
MIT License
2.85k stars 355 forks source link

lora训练 多卡报错 #112

Closed aihaidong closed 1 year ago

aihaidong commented 1 year ago

我用仓库中的脚本,模型使用的是chatglm-6b试了很多次多卡报错都卡在这个地方 image

我按照readme方式,吧thuglm文件夹下的文件复制到模型文件中,报错如下: image

请问大佬我是需要指定张量的存放吗

aihaidong commented 1 year ago

我发现我的问题了,我用的新模型,用老模型就可以了

Ardang666 commented 1 year ago

最后用的是个 commit的模型啊,用作者截图的commit,也跑不了

Ardang666 commented 1 year ago

用 dddd 可以跑起来