finetune_dataset_maker

注：新版的openai包改了api接口的用法，要使用现有代码请安装旧版，pip install openai==0.28.0

介绍视频在https://www.bilibili.com/video/BV1mg4y1g718/

懒得配环境请使用这位的整合包https://www.bilibili.com/video/BV1Qg4y1g7Ky

ChatGLM一站式微调整合包https://www.bilibili.com/video/BV1P24y1L7Ge

pip安装最新版的streamlit和openai，执行这一句即可运行（port可以随便改）

streamlit run dataset.py --server.port 2323

支持以下ChatGLM微调项目的格式

主要功能是读取用户写在txt的问题，并通过GPT生成回答，或者用户自行撰写回答，然后保存为微调需要的json文件

首先打开网页，我们可以选择要回答的问题，选定之后填写答案，也可以选择使用GPT的api来流式生成回答，确认并进入下一个问题

如果回答为空的话，就会删掉未保存的对应回答

保存全部回答，可以将回答序列化写入本地文件以便下次读取。

导出Json的话，会将所有已保存回答写到本地而未保存的回答就会忽略。

用代理的同学记得按照左边的端口号修改代码，不用代理请删掉这两行

改这里切换输出json的格式

huang1332 / finetune_dataset_maker