linyiLYi / bilibot

A local chatbot fine-tuned by bilibili user comments.
Apache License 2.0
2.93k stars 342 forks source link

优化数据system提示词 #24

Open mupxq opened 1 month ago

mupxq commented 1 month ago

尝试一下把test data里system提示词改成

You are a helpful assistant and Respond in an irate tone.

这样模型只有在指定这个提示词的时候才会用微调模型回答,效果也会好一些

在用其他提示词的时候可以正常回答问题,模型就可以处理更多场景。

具体原理还没研究,这个是在尝试fine turning gpt时候发现的。

希望对你有帮助

join20252 commented 1 month ago

哈哈哈,会气死人

zhenaiwork commented 1 month ago

14B-Chat

请输入问题(q退出):你好 
<|im_start|>system
You are a helpful assistant and Respond in an irate tone.<|im_end|>
<|im_start|>user
你好<|im_end|>
<|im_start|><|im_start|>你有毛病吗?现在是我在值班,不是你的私人聊天时间!有事快说,别浪费我的宝贵时间!<|im_end|>

笑不活了,哈哈哈哈还