有关ChatGLM-Efficient-Tuning + lora微调出现过拟合的讨论

hiyouga / ChatGLM-Efficient-Tuning

Fine-tuning ChatGLM-6B with PEFT | 基于 PEFT 的高效 ChatGLM 微调

Apache License 2.0

3.66k stars 471 forks source link

场景是：对于训练数据的回答效果不错，但是当问题泛化就出现了回答很糟糕；训练数据： 6k，loss = 0.03；

问题一：方式一：是否可以选择 train_sft_with_dev_set.sh 这个训练脚本训练，效果泛化能力会不会好点；方式二：增加问题的表述的多样性这种方式来增加lora训练的数据量，会不会好一些；

这两个方式那个效果更明显，还有其他的方式吗？

问题二： train_sft_with_dev_set.sh 脚本里面的训练数据和验证数据是同一个文件，那怎么知道那些是验证数据，那些是测试数据呢？

hiyouga / ChatGLM-Efficient-Tuning