zhangzhenyu13 / llm3s-conatiner

large language model training-3-stages+deployment
46 stars 12 forks source link

业务数据集说明 #1

Closed yejiahaoye closed 1 year ago

yejiahaoye commented 1 year ago

希望对业务的收集方法和种类有详细的介绍

zhangzhenyu13 commented 1 year ago

业务数据集包含分类、qq对、ner等很多任务,你只需要手写几个instruction,构建成instruction、input+output(业务数据的格式),这样取请求我们的chatgpt的self-instruct扩展接口就可以。 我们的sft-data-construction里面有关于请求chatgpt-self-instruct的的代码。