Closed feifei05 closed 6 months ago
![Uploading 3.png…]()
上面是inputs[0],preds[0], labels[0], inputs[0]原始输入完全正确,preds[0]预测结果乱码,不出现label分隔符,inputs[0]是原始label。为什么preds[0]和inputs[0]前面的系统提示词和instruction不同
preds本身就是模型从第一个预测token开始的输出,前面乱的正常。想计算acc要看你的loss计算方式,loss计算方式影响数据处理的形式和metric计算,比如只看SFT数据的response
部分,自己调试一下吧,不是我们repo相关的问题。
"SFT数据的response"这是指哪个函数的输出,如果用generate生成的response是可以拿到label,但是这种方式很慢
提交前必须检查以下项目
问题类型
模型训练与精调
基础模型
Chinese-Alpaca-2 (7B/13B)
操作系统
Linux
详细描述问题
依赖情况(代码类问题务必提供)
运行日志或截图