Closed yinjiaoyuan closed 1 year ago
请问基于llama2微调自己的模型流程也是把下面五个步骤都先后做一遍吗?我只是在llama2基础上增加我自己的训练数据微调,不需要全量训练。谢谢。 Pre-Training Supervised Fine-Tuning Reward Modeling PPO Training DPO Training
问 ChatGPT
请问基于llama2微调自己的模型流程也是把下面五个步骤都先后做一遍吗?我只是在llama2基础上增加我自己的训练数据微调,不需要全量训练。谢谢。 Pre-Training Supervised Fine-Tuning Reward Modeling PPO Training DPO Training