商用7b模型，直接进行推理说话毫无逻辑，难道不是开箱即用的嘛？

dandelionsllm / pandallm

Panda项目是于2023年5月启动的开源海外中文大语言模型项目，致力于大模型时代探索整个技术栈，旨在推动中文自然语言处理领域的创新和合作。

Apache License 2.0

1.07k stars 91 forks source link

Closed Goo-goo-goo closed 1 year ago

Goo-goo-goo commented 1 year ago

微信图片_20230606141643 还出现乱码情况，求解答，

SparkJiao commented 1 year ago

OpenLLaMA的预训练token比较少所以能力不太够强另外我们没有给他很多对话的数据进行训练，以百科和问答为主，以及少量的代码相关的指令。不要期望他能和你进行多轮对话，你可以问他一些比较明确的问题，比如“迈克尔乔丹是谁？“或者“阅读以下文章，回答问题：<文章> <问题>”等

Goo-goo-goo commented 1 year ago

好的吧谢谢你

SparkJiao commented 1 year ago

库里有13B的可以试试另外使用了更多对话和指令数据的13B模型以及65B-lora模型近期会开源可以等一下大概一周以内

Goo-goo-goo commented 1 year ago

嗯嗯嗯非常感谢