Facico / Chinese-Vicuna

Chinese-Vicuna: A Chinese Instruction-following LLaMA-based Model —— 一个中文低资源的llama+lora方案,结构参考alpaca
https://github.com/Facico/Chinese-Vicuna
Apache License 2.0
4.14k stars 421 forks source link

关于数据集的准备和处理 #187

Closed kostya-sec closed 1 year ago

kostya-sec commented 1 year ago

您好。我想尝试微调关于剧本的Lora。我看到指令精调使用数据模板是 { "instruction": "", "input": "", "output": "" } 我的原始数据类似下面这种: 一些环境描述和背景描述。 旁白:旁白说的话1. 角色1:角色1的话1. (角色情绪和动作) 角色2:角色2的话1. (角色情绪和动作) xxxx

如果是这样的话,想请教一下应该怎么样处理源数据到模板数据会比较合适。非常感谢

Facico commented 1 year ago

参考这里把任务描述清楚就好。 或者参照一下这个issue:#152

kostya-sec commented 1 year ago

参考这里把任务描述清楚就好。 或者参照一下这个issue:#152

谢谢。我尝试一下