Closed JingyuHuAtVoxelCloud closed 1 year ago
只加载sft的权重脚本:
CUDA_VISIBLE_DEVICES=1 python src/train_bash.py \ --stage sft \ --model_name_or_path THUDM/chatglm2-6b \ --do_predict \ --dataset ft_test \ --dataset_dir data/medicalgpt \ --finetuning_type lora \ --checkpoint_dir outputs/output-sft-chatglm2/checkpoint-12000 \ --output_dir outputs/output-rl-chatglm2 \ --per_device_eval_batch_size 8 \ --predict_with_generate \ --max_samples 100 \
加载sft和ppo权重的脚本:
CUDA_VISIBLE_DEVICES=1 python src/train_bash.py \ --stage sft \ --model_name_or_path THUDM/chatglm2-6b \ --do_predict \ --dataset ft_test \ --dataset_dir data/medicalgpt \ --finetuning_type lora \ --checkpoint_dir outputs/output-sft-chatglm2/checkpoint-12000,outputs/output-rl-chatglm2/checkpoint-2000 \ --output_dir outputs/output-rl-chatglm2 \ --per_device_eval_batch_size 8 \ --predict_with_generate \ --max_samples 100 \
same problem
请问是说两个不同的脚本最后 eval metrics 输出的指标数字相等,还是什么意思?
bleu这些指标通过上面两个不同的脚本计算得到的结果是一样的。
我遇到的是ppo训练后的模型指标与sft前的模型指标是一样的。感觉ppo训练后的adaptor没有正确保存或者正确加载?
只加载sft的权重脚本:
加载sft和ppo权重的脚本: