dandelionsllm / pandallm

Panda项目是于2023年5月启动的开源海外中文大语言模型项目,致力于大模型时代探索整个技术栈,旨在推动中文自然语言处理领域的创新和合作。
Apache License 2.0
1.06k stars 91 forks source link

关于评估选用的BELLE baseline问题 #4

Closed hejujie closed 1 year ago

hejujie commented 1 year ago

想问下这边评估选用的是左边红色的open-dataset模型,还是右边的ext模型。 如果按照这readme的名字,应该是用的右边的模型,这个ext的模型应该是刚扩完词表的,open-datasets才是它们论文里面的最优模型。不确定是否这里就是只是想测试ext的效果。 image 对应的BELLE论文中的表格(绿色为ext,红色为open-datasets): image

SparkJiao commented 1 year ago

感谢提醒,我看到模型的名字都叫EXT所以以为LLaMA-EXT-7B就是论文中最好的模型。我们会尽快补充相关模型的实验并测试,谢谢你的反馈!