请问PPO trainner之后有evaluate 和predict的方法吗，目前只看到有train，是需要自己去trl 库上找inference的方法吗 - Githubissues

hiyouga / ChatGLM-Efficient-Tuning

Fine-tuning ChatGLM-6B with PEFT | 基于 PEFT 的高效 ChatGLM 微调

Apache License 2.0

3.65k stars 471 forks source link

请问PPO trainner之后有evaluate 和predict的方法吗，目前只看到有train，是需要自己去trl 库上找inference的方法吗 #106

Closed JoyDajunSpaceCraft closed 1 year ago

hiyouga commented 1 year ago

使用 PPO 训练完模型后，可以使用 train_sft.py 进行 evaluation 和 prediction。