Open dle666 opened 2 months ago
Did you set .eval() mode during inference?
您在推理过程中是否设置了 .eval() 模式?
我已经设置了eval,并且我发现当我把在geo3k的训练集上lora微调后的模型(loss已下降到0.03)再次加载在同一数据集上进行训练时,loss又变为了1.7,是否是模型保存或加载出现了问题(原代码加载微调后的模型会报错,我是使用automodel加载的)
您在推理过程中是否设置了.eval()模式?
您在推理过程中是否设置了.eval()模式?
我已经设置了eval,并且我发现当我把在geo3k的训练集上lora参数后的模型(loss已恢复到0.03)再次加载在相同数据集上进行时,loss又变成了1.7,是否是模型保存或加载出现了问题(原代码加载操作后的模型会报错,我是使用automodel加载的)
补充一下,我在全参数微调时并没有遇见这种情况
It looks like your LoRA model is not loaded correctly. Do u use the AutoPeftModelForCausalLM
class here?
我对一张图片微调至过拟合,训练过程中生成的答案与真值已经完全相同,但是我加载此模型去测试同一张图发现,生成的结果和真值句式和顺序的差别很大,这是为什么呢,请给我一些帮助