Closed mawenju203 closed 1 year ago
场景是:对于训练数据的回答效果不错,但是当问题泛化就出现了回答很糟糕; 训练数据: 6k,loss = 0.03;
问题一: 方式一:是否可以选择 train_sft_with_dev_set.sh 这个训练脚本训练,效果泛化能力会不会好点; 方式二:增加问题的表述的多样性这种方式来增加lora训练的数据量,会不会好一些;
这两个方式那个效果更明显,还有其他的方式吗?
问题二: train_sft_with_dev_set.sh 脚本里面的训练数据和验证数据是同一个文件,那怎么知道那些是验证数据,那些是测试数据呢?
随机划分
@hiyouga 谢谢了 @codemayq 开源的训练集都是可以的吗?是不是加些代码生成的,会更有帮助呢
场景是:对于训练数据的回答效果不错,但是当问题泛化就出现了回答很糟糕; 训练数据: 6k,loss = 0.03;
问题一: 方式一:是否可以选择 train_sft_with_dev_set.sh 这个训练脚本训练,效果泛化能力会不会好点; 方式二:增加问题的表述的多样性这种方式来增加lora训练的数据量,会不会好一些;
这两个方式那个效果更明显,还有其他的方式吗?
问题二: train_sft_with_dev_set.sh 脚本里面的训练数据和验证数据是同一个文件,那怎么知道那些是验证数据,那些是测试数据呢?