关于评估选用的BELLE baseline问题

dandelionsllm / pandallm

Panda项目是于2023年5月启动的开源海外中文大语言模型项目，致力于大模型时代探索整个技术栈，旨在推动中文自然语言处理领域的创新和合作。

Apache License 2.0

1.06k stars 91 forks source link

关于评估选用的BELLE baseline问题 #4

Closed hejujie closed 1 year ago

hejujie commented 1 year ago

想问下这边评估选用的是左边红色的open-dataset模型，还是右边的ext模型。如果按照这readme的名字，应该是用的右边的模型，这个ext的模型应该是刚扩完词表的，open-datasets才是它们论文里面的最优模型。不确定是否这里就是只是想测试ext的效果。对应的BELLE论文中的表格（绿色为ext，红色为open-datasets）：

SparkJiao commented 1 year ago

感谢提醒，我看到模型的名字都叫EXT所以以为LLaMA-EXT-7B就是论文中最好的模型。我们会尽快补充相关模型的实验并测试，谢谢你的反馈！