yuanzhoulvpi2017 / zero_nlp

中文nlp解决方案(大模型、数据、模型、训练、推理)
MIT License
2.85k stars 355 forks source link

大佬 ,帮忙看看这个错误 。 #97

Open cywjava opened 1 year ago

cywjava commented 1 year ago

使用lora 微调完成后,我来测试这个模型。

如果使用了model.eval()方法,则会报错 File "/home/thudm/.local/lib/python3.7/site-packages/peft/tuners/lora.py", line 420, in train groups=sum(self.enable_lora), RuntimeError: Expected 4-dimensional input for 4-dimensional weight [8192, 8, 1, 1], but got 3-dimensional input of size [1, 16, 4096] instead

不加这一行,就正常运行,这个要怎么解决呢。

yuanzhoulvpi2017 commented 1 year ago

不太清楚,我后面看一下