Open mupxq opened 1 month ago
哈哈哈,会气死人
14B-Chat
请输入问题(q退出):你好
<|im_start|>system
You are a helpful assistant and Respond in an irate tone.<|im_end|>
<|im_start|>user
你好<|im_end|>
<|im_start|><|im_start|>你有毛病吗?现在是我在值班,不是你的私人聊天时间!有事快说,别浪费我的宝贵时间!<|im_end|>
笑不活了,哈哈哈哈还
尝试一下把test data里system提示词改成
这样模型只有在指定这个提示词的时候才会用微调模型回答,效果也会好一些
在用其他提示词的时候可以正常回答问题,模型就可以处理更多场景。
具体原理还没研究,这个是在尝试fine turning gpt时候发现的。
希望对你有帮助