DLLXW / baby-llama2-chinese

用于从头预训练+SFT一个小参数量的中文LLaMa2的仓库;24G单卡即可运行得到一个具备简单中文问答能力的chat-llama2.
MIT License
2.34k stars 288 forks source link

交个作业吧 #70

Closed yasohasakii closed 2 months ago

yasohasakii commented 2 months ago

预训练的eval,怎么说呢。。。 image