yuanzhoulvpi2017 / zero_nlp

中文nlp解决方案(大模型、数据、模型、训练、推理)
MIT License
3.04k stars 369 forks source link

【Chatglm6b_ModelParallel问题报错】 #141

Open oier991215 opened 1 year ago

oier991215 commented 1 year ago

您好! 我在huggingface上获取了chatglm所有文件,将 您thuglm文件夹下没有的文件(包括8个.bin文件)都放到了thuglm文件夹内。

train_model_all.py中也添加了device序号(从0到7,我这里是8卡),但还是出现了下面错误,您能否能分析一下呢?

oier991215 commented 1 year ago

QQ图片20230723060505

yuanzhoulvpi2017 commented 1 year ago

看这个样子,是下载的chatglm版本不对吧,用我的chatglm-dddd试一试。

但是建议还是使用chtaglm2版本的训练方法吧。chatglm1不要用了