DLLXW / baby-llama2-chinese

用于从头预训练+SFT一个小参数量的中文LLaMa2的仓库;24G单卡即可运行得到一个具备简单中文问答能力的chat-llama2.
MIT License
2.42k stars 296 forks source link

数据集问题 #23

Open zhihui-shao opened 11 months ago

zhihui-shao commented 11 months ago

你好,我首次尝试训练一个模型,请问数据集要下载,放在哪里

taiyouZhang commented 10 months ago

根据代码的设计,需要在py文件同层下创建data目录 数据集放入data目录即可

Yukang-Lin commented 7 months ago

您好,数据链接需要密码,可以分享下吗

Gnabree commented 7 months ago

同问百度网盘数据集密码