Closed JoyDajunSpaceCraft closed 1 year ago
使用 PPO 训练完模型后,可以使用 train_sft.py 进行 evaluation 和 prediction。
使用 PPO 训练完模型后,可以使用 train_sft.py 进行 evaluation 和 prediction。