dandelionsllm / pandallm

Panda项目是于2023年5月启动的开源海外中文大语言模型项目,致力于大模型时代探索整个技术栈,旨在推动中文自然语言处理领域的创新和合作。
Apache License 2.0
1.07k stars 91 forks source link

词表没扩充过是吗?还是32,000吧? #19

Closed mellivoraPKU closed 1 year ago

mellivoraPKU commented 1 year ago

词表没扩充过是吗?还是32,000吧?为什么没有基于扩充词表后的llama,比如基于belle的

SparkJiao commented 1 year ago

没有扩充过,因为有点麻烦,且效果不确定,我们开始做的时候belle的report还没有放出来