hiyouga / ChatGLM-Efficient-Tuning

Fine-tuning ChatGLM-6B with PEFT | 基于 PEFT 的高效 ChatGLM 微调
Apache License 2.0
3.65k stars 471 forks source link

请问PPO trainner之后有evaluate 和predict的方法吗,目前只看到有train,是需要自己去trl 库上找inference的方法吗 #106

Closed JoyDajunSpaceCraft closed 1 year ago

hiyouga commented 1 year ago

使用 PPO 训练完模型后,可以使用 train_sft.py 进行 evaluation 和 prediction。