扩充词表后对新添加token初始化的方式

YoLo-MUC commented 7 months ago

其他问题

Chinese-LLaMA-2 (7B/13B)

Linux

老师您好，请问对原32000的词表扩充后，对新添加的token在模型的embedding层和lm_head层初始化的方式是什么呢？

我看他人有做均值扩充、随机扩充和带噪均值扩充，但是不知道有什么选择技巧，想请教下老师的看法和咱们LLaMA2-Chinese所选择的方式，谢谢老师！

# 请在此处粘贴依赖情况（请粘贴在本代码块里）

# 请在此处粘贴运行日志（请粘贴在本代码块里）

ymcui commented 7 months ago

均值初始化效果相对较好。

YoLo-MUC commented 7 months ago

均值初始化效果相对较好。

好的，谢谢老师

ymcui / Chinese-LLaMA-Alpaca-2