利用WebUI做Evaluation&Predict的过程中，最后没有预测结果也没有bleu和rouge的值

hiyouga / LLaMA-Factory

Unified Efficient Fine-Tuning of 100+ LLMs (ACL 2024)

https://arxiv.org/abs/2403.13372

Apache License 2.0

33.66k stars 4.14k forks source link

利用WebUI做Evaluation&Predict的过程中，最后没有预测结果也没有bleu和rouge的值 #4286

Closed KATHERINE0511 closed 4 months ago

KATHERINE0511 commented 4 months ago

sft阶段微调了一个glm4-chat-9b模型，训练过程一切顺利，在推理阶段卡住了，没有预测结果也没有bleu和rouge的值如下图所示 img_v3_02br_d00fcfca-bba1-4cb6-a713-ffd4b68193ag img_v3_02br_7983a466-d6bc-438f-94ee-c16888a5ce7g

KATHERINE0511 commented 4 months ago

llamafactory-cli train \ --stage sft \ --model_name_or_path /data/xqliu/ZhipuAI/glm-4-9b-chat \ --preprocessing_num_workers 16 \ --finetuning_type lora \ --template glm4 \ --flash_attn auto \ --dataset_dir /home/ytwu/PROJECT/LLaMA-Factory-main/data/practice_dataset_guabganmen_sft \ --dataset guanganmen_cheest_data_test_sft \ --cutoff_len 1024 \ --max_samples 100000 \ --per_device_eval_batch_size 2 \ --predict_with_generate True \ --max_new_tokens 512 \ --top_p 0.7 \ --temperature 0.95 \ --output_dir saves/GLM-4-9B-Chat/lora/sft_GLM4_9B_chat_test_lora_lr1.0e-4_5000 \ --do_predict True这个是预览命令

hiyouga commented 4 months ago

我这边可以正常运行，检查一下你的文件系统权限

HoraceXIaoyiBao commented 2 months ago

llamafactory-cli train --stage sft --model_name_or_path /data/xqliu/ZhipuAI/glm-4-9b-chat --preprocessing_num_workers 16 --finetuning_type lora --template glm4 --flash_attn auto --dataset_dir /home/ytwu/PROJECT/LLaMA-Factory-main/data/practice_dataset_guabganmen_sft --dataset guanganmen_cheest_data_test_sft --cutoff_len 1024 --max_samples 100000 --per_device_eval_batch_size 2 --predict_with_generate True --max_new_tokens 512 --top_p 0.7 --temperature 0.95 --output_dir saves/GLM-4-9B-Chat/lora/sft_GLM4_9B_chat_test_lora_lr1.0e-4_5000 --do_predict True这个是预览命令

请问解决了吗，同样的问题