Closed xxyp closed 4 months ago
1、增量预训练使用的是base模型吧?chat模型可以增量预训练吗,chat模型增量预训练会破坏chat的能力吗? 2、如果使用base模型进行增量预训练,sft的时候是不是得使用比较多的通用指令或者垂域数据重新进行指令微调才会有比较好的结果?
1、PT可以用base、chat都行,chat模型继续PT会劣化其对齐能力,需要再SFT;
嗯嗯好的,了解,感谢大佬~
Describe the Question
1、增量预训练使用的是base模型吧?chat模型可以增量预训练吗,chat模型增量预训练会破坏chat的能力吗? 2、如果使用base模型进行增量预训练,sft的时候是不是得使用比较多的通用指令或者垂域数据重新进行指令微调才会有比较好的结果?