DLLXW / baby-llama2-chinese

用于从头预训练+SFT一个小参数量的中文LLaMa2的仓库;24G单卡即可运行得到一个具备简单中文问答能力的chat-llama2.
MIT License
2.47k stars 305 forks source link

模型效果 #47

Closed AI-Study-Han closed 6 months ago

AI-Study-Han commented 9 months ago

确定训练出的模型可以完成基本的回答吗?为什么我训练的模型都是乱说。https://github.com/AI-Study-Han/Mini-Llama2-Chinese

AI-Study-Han commented 9 months ago

能给个训练好的测试一下吗?

DLLXW commented 9 months ago

能给个训练好的测试一下吗?

加下我微信:qq2257164884

DLLXW commented 9 months ago

确定训练出的模型可以完成基本的回答吗?为什么我训练的模型都是乱说。https://github.com/AI-Study-Han/Mini-Llama2-Chinese

https://github.com/DLLXW/baby-llama2-chinese/issues/50

应该是这个原因