DLLXW / baby-llama2-chinese

用于从头预训练+SFT一个小参数量的中文LLaMa2的仓库;24G单卡即可运行得到一个具备简单中文问答能力的chat-llama2.
MIT License
2.47k stars 305 forks source link

模型的回答较长,输出结果不完整要怎么解决 #80

Open MSJeinlong opened 3 months ago

MSJeinlong commented 3 months ago

作者您好,从结果不同参数模型的推理效果来看,模型的answer较长时,输出结果并不完整。就是模型的答案给到一半就断了,原因是什么?要如何解决?