DLLXW / baby-llama2-chinese

用于从头预训练+SFT一个小参数量的中文LLaMa2的仓库;24G单卡即可运行得到一个具备简单中文问答能力的chat-llama2.
MIT License
2.47k stars 305 forks source link

第一轮练完了正在跑第二轮。不能能加个脚本转格式能让obabooga使用? #41

Open limao999666 opened 11 months ago

limao999666 commented 11 months ago

第一轮练完了loss3左右,正在跑第二轮。不能能加个脚本转格式能让obabooga使用? 命令行用起来对话总觉得不舒服