yxuansu / PandaGPT

[TLLM'23] PandaGPT: One Model To Instruction-Follow Them All
https://panda-gpt.github.io/
Apache License 2.0
768 stars 60 forks source link

请问我想在你们的基础上继续训练stage,应该怎么改openllama_peft_stage_1.json这个文件? #13

Open hangzeli08 opened 1 year ago

hangzeli08 commented 1 year ago

请问什么时候发布stage2的相关代码和配置文件呢,我现在想在你们训练好的基础上进行微调,应该改动哪些文件呢,如何修改openllama_peft_stage_1.json里面的参数呢,还是直接复制openllama_peft_stage_1.json到openllama_peft_stage_2.json就可以呢

gmftbyGMFTBY commented 1 year ago

可以直接复制,不过我们试验后发现stage1和stage2没有什么太大的差别,直接使用stage1就可以达到很好的效果了,所以我们这里没有很关注stage2的效果