hikariming / chat-dataset-baseline

人工精调的中文对话数据集和一段chatglm的微调代码
1.13k stars 95 forks source link

数据标注 #77

Open LeiYuAndy opened 1 year ago

LeiYuAndy commented 1 year ago

请问一下,对话模型的数据集一般是怎么获取的,有没有什么数据标注的软件

hikariming commented 1 year ago

我们是接了openai、还有chat13b的api,然后再基于它的回答微调出来的

LeiYuAndy commented 1 year ago

明白了,谢谢指导,一般LLM模型的训练数据有什么标注工具吗