Closed mechigonft closed 5 months ago
是的,您可以使用类似于推理阶段的fim标签的拼接。比较简单有效的方法,我们建议,先不要拼接任何chat format格式,直接将plain text作为输入。
感谢回复,我想进一步了解下:你指的“先不要拼接任何chat format格式”是指的llama Factory上面的template字段,训练模板吗?如果是base模型,我好像可以直接指定template为default吧?
default的训练模板好像并不太对,因为会加上Human、Assistant等信息
是的建议,先不要增加这些模版,可能会降低训练难度。更丰富的训练策略,我们正在探索中
codeQwen是非常伟大的工作,感谢开发团队的付出! 想要对Base模型的FIM推理方式进行微调,微调训练的数据格式是怎么样的?输入是类似于推理阶段的fim标签的拼接吗?输出是期望生成的代码段内容?