mymusise / ChatGLM-Tuning

基于ChatGLM-6B + LoRA的Fintune方案
MIT License
3.73k stars 440 forks source link

如何自己生成alpaca_data.json 数据 alpaca_data.jsonl 是用来干嘛的 #148

Open dragononly opened 1 year ago

mymusise commented 1 year ago

alpaca_data.json 可以参考 https://github.com/tatsu-lab/stanford_alpaca

alpaca_data.jsonl 只是转了下格式,具体可以看cover_alpaca2jsonl.py

dragononly commented 1 year ago

alpaca_data.json 可以参考 https://github.com/tatsu-lab/stanford_alpaca

alpaca_data.jsonl 只是转了下格式,具体可以看cover_alpaca2jsonl.py

明白了alpaca_data.jsonl 是当作测试集data是嘛?