yangjianxin1 / Firefly

Firefly: 大模型训练工具,支持训练Qwen2.5、Qwen2、Yi1.5、Phi-3、Llama3、Gemma、MiniCPM、Yi、Deepseek、Orion、Xverse、Mixtral-8x7B、Zephyr、Mistral、Baichuan2、Llma2、Llama、Qwen、Baichuan、ChatGLM2、InternLM、Ziya2、Vicuna、Bloom等大模型
5.85k stars 525 forks source link

灾难性遗忘 #96

Open aresspark opened 1 year ago

aresspark commented 1 year ago

替换为自己的数据集微调百川Baichuan-13B之后,出现了模型基础对话能力丧失的情况,不知道算不算是灾难性遗忘,有发现过这个问题的友友们可以指导一下解决我的问题吗

Galeno2012 commented 1 year ago

同楼主,在win11平台上微调baichuan-13b后,模型难以进行大多数基础对话,会输出形如“ ”或“<b%r><b%r><b%r><b%r><b%r><b%r><b%r>(即换行符,实际输出内容请去掉“%”)”的消息。我使用的finetuning项目是LLaMA-Efficient-Tuning,现在主要头疼于不清楚问题出在哪。

calvinzhan commented 1 year ago

@aresspark 你是在baichuan-13b上直接用自己数据集训练的吗?baichuan的应该没有啥对话能力。有试过firefly-baichuan-13b上训练吗?我在firefly-baichuan-7b上训练。对话能力没丧失。如果在baichuan上训练,估计要加上moss那个对话集一起训练。

aresspark commented 1 year ago

moss那个对话

好的,感谢您的建议,我会参考此实行

yangjianxin1 commented 1 year ago

替换为自己的数据集微调百川Baichuan-13B之后,出现了模型基础对话能力丧失的情况,不知道算不算是灾难性遗忘,有发现过这个问题的友友们可以指导一下解决我的问题吗

百川Baichuan-13B-Base是没有对话能力的,你的微调数据是对话数据吗