Pillars-Creation / ChatGLM-RLHF-LoRA-RM-PPO

ChatGLM-6B添加了RLHF的实现,以及部分核心代码的逐行讲解 ,实例部分是做了个新闻短标题的生成,以及指定context推荐的RLHF的实现
Apache License 2.0
78 stars 8 forks source link

网页部署报错 #4

Open wuQi-666 opened 11 months ago

wuQi-666 commented 11 months ago

Is there an existing issue for this?

Current Behavior

你好,我按照你的流程完成了sft、rm 和 ppo 的训练,现在使用web_dem的方式部署,运行保存显示checkpoint路径下没有pytorch_model.bin文件。报错如下: 图片 web_demo.sh文件中的参数如下: 图片 之前使用sft进行微调生成的checkpoint文件中也不会有 pytorch_model.bin 文件,请问这里哪里出现错误了,谢谢

Expected Behavior

感谢

Steps To Reproduce

environment

Environment

- OS:
- Python:
- Transformers:
- PyTorch:
- CUDA Support (`python -c "import torch; print(torch.cuda.is_available())"`) :

Anything else?

期待你的回复