dandelionsllm / pandallm

Panda项目是于2023年5月启动的开源海外中文大语言模型项目,致力于大模型时代探索整个技术栈,旨在推动中文自然语言处理领域的创新和合作。
Apache License 2.0
1.07k stars 91 forks source link

模型合并推理结果不正常 #5

Closed xxxxuee closed 1 year ago

xxxxuee commented 1 year ago

使用了LLaMA HF版本的权重和[llama-panda-zh-coig-7b-delta]做合并,预测的效果比较差。 image

SparkJiao commented 1 year ago

Hi,之前的合并代码有点问题,不确定是否合并成功,可以拉一下最新的代码再试试。另外我用合并后的代码测试了你的例子,结果放在下面:

image

确实这个模型在短chat方面表现并不好,原因可能是因为COIG和pre-train的数据还是以任务导向为主,问答和翻译为主。对于第二个例子模型能够给出答案,例子里也测试了是否开启beam search的情况。不过这个题目我本身也不太清楚答案是什么,所以不知道哪个是对的。目前7B的模型能力还是很欠缺,13B训好以后我们会尽快release权重并在更多benchmark上测试。

Thanks!

jeinlee1991 commented 1 year ago

@SparkJiao Panda-Instruct-7B, 我遇到类似的推理问题,结果看起来很不正常,举例: 1、[input]: 你是谁

2、[input]: 你采用什么模型 output: 来处理这个问题? 这个问题可以使用逻辑回归模型来处理。

不知道模型加载有没有问题。如果确定模型无误的话,那么这样的效果难以做chat啊,和belle-llama-7b有明显差距。

lucasjinreal commented 1 year ago

image

jeinlee1991 commented 1 year ago

image

这个效果看起来正常,方便把推理代码贴出来嘛?

lucasjinreal commented 1 year ago

这个是我们自己的训的模型

SparkJiao commented 1 year ago

@jeinlee1991 前面已经回复过了,COIG微调的模型就是没法Chat,是用来做任务的,我们现在有13B用于Chat的模型,对话效果很不错,可以在Telegram上试用,链接在这里:https://t.me/PandaLLMChat_bot 38f5396722ac0ed90fb00d146e7e740 3eaf498105298d8beeb84cfc0cc36a4 edfca2549cd2897780ea321b2609cec 0d44b9ea00db9f4263064ddcd0f7e92

这里有一些例子可以参考

另外 @lucasjinreal 这位同学 在别人家的Repo下面打自己家的广告不是很好哈 你们可以去社交平台上宣传自己

lucasjinreal commented 1 year ago

@SparkJiao 我既没有列出我模型名字,也没有列出任何相关信息,不存在广告不广告。

另外阿凡达2009年才首次上映啊。(无意冒犯,纠正个事实哈)

image

jeinlee1991 commented 1 year ago

@jeinlee1991 前面已经回复过了,COIG微调的模型就是没法Chat,是用来做任务的,我们现在有13B用于Chat的模型,对话效果很不错,可以在Telegram上试用,链接在这里:https://t.me/PandaLLMChat_bot 38f5396722ac0ed90fb00d146e7e740 3eaf498105298d8beeb84cfc0cc36a4 edfca2549cd2897780ea321b2609cec 0d44b9ea00db9f4263064ddcd0f7e92

这里有一些例子可以参考

另外 @lucasjinreal 这位同学 在别人家的Repo下面打自己家的广告不是很好哈 你们可以去社交平台上宣传自己

后续会开放chat模型下载吗?很期待!

SparkJiao commented 1 year ago

@jeinlee1991 会开放的,现在还在只训练了一半左右,跑完所有数据之后会放出权重。月底之前。

jeinlee1991 commented 1 year ago

@jeinlee1991 会开放的,现在还在只训练了一半左右,跑完所有数据之后会放出权重。月底之前。

好的,谢谢!期待……

SparkJiao commented 1 year ago

@jeinlee1991 13B-Chat的权重开放,可以参考README下载。目前只是中间版本。全部训练完成之后会发布新的权重。