Closed KATHERINE0511 closed 4 months ago
llamafactory-cli train \ --stage sft \ --model_name_or_path /data/xqliu/ZhipuAI/glm-4-9b-chat \ --preprocessing_num_workers 16 \ --finetuning_type lora \ --template glm4 \ --flash_attn auto \ --dataset_dir /home/ytwu/PROJECT/LLaMA-Factory-main/data/practice_dataset_guabganmen_sft \ --dataset guanganmen_cheest_data_test_sft \ --cutoff_len 1024 \ --max_samples 100000 \ --per_device_eval_batch_size 2 \ --predict_with_generate True \ --max_new_tokens 512 \ --top_p 0.7 \ --temperature 0.95 \ --output_dir saves/GLM-4-9B-Chat/lora/sft_GLM4_9B_chat_test_lora_lr1.0e-4_5000 \ --do_predict True这个是预览命令
我这边可以正常运行,检查一下你的文件系统权限
llamafactory-cli train --stage sft --model_name_or_path /data/xqliu/ZhipuAI/glm-4-9b-chat --preprocessing_num_workers 16 --finetuning_type lora --template glm4 --flash_attn auto --dataset_dir /home/ytwu/PROJECT/LLaMA-Factory-main/data/practice_dataset_guabganmen_sft --dataset guanganmen_cheest_data_test_sft --cutoff_len 1024 --max_samples 100000 --per_device_eval_batch_size 2 --predict_with_generate True --max_new_tokens 512 --top_p 0.7 --temperature 0.95 --output_dir saves/GLM-4-9B-Chat/lora/sft_GLM4_9B_chat_test_lora_lr1.0e-4_5000 --do_predict True这个是预览命令
请问解决了吗,同样的问题
sft阶段微调了一个glm4-chat-9b模型,训练过程一切顺利,在推理阶段卡住了,没有预测结果也没有bleu和rouge的值如下图所示