seanzhang-zhichen / llama3-chinese

Llama3-Chinese是以Meta-Llama-3-8B为底座,使用 DORA + LORA+ 的训练方法,在50w高质量中文多轮SFT数据 + 10w英文多轮SFT数据 + 2000单轮自我认知数据训练而来的大模型。
Apache License 2.0
289 stars 21 forks source link

大佬,能不能写一个基于deepctrl-sft-data微调的教程,谢谢 #4

Closed bestlee666 closed 7 months ago

bestlee666 commented 7 months ago

大佬,能不能写一个基于deepctrl-sft-data微调的教程,谢谢

seanzhang-zhichen commented 7 months ago

大佬,能不能写一个基于deepctrl-sft-data微调的教程,谢谢

暂时没时间,你可以使用llama factory试试,这个项目是基于llama factory框架训的