zhihaiLLM / wisdomInterrogatory

Apache License 2.0
462 stars 36 forks source link

SFT 领域指令微调数据构建方式 #5

Closed yejiahaoye closed 10 months ago

yejiahaoye commented 10 months ago

能够详细说明一下SFT 领域指令微调数据构建方式, 是通过self-instruct 等方式来实现的么,能够公布一下SFT构建的代码

wuyiquan commented 10 months ago

你好,我们一方面是清洗了公开的领域问答数据,一方面是利用chatgpt来反向生成的sft数据,构造sft数据的prompt代码,可以参考 luwen_baichuan/data_demo/README.md