Closed SXxinxiaosong closed 3 months ago
openfunction任务的评估的实现使用了正则表达式,详见这个文件。在脚本中的评估位于:
python "eval/eval_openfunction.py" --input_file "${output_dir}/generated_predictions.jsonl" >> ${result_file}
我在本地将给出的jsonl文件的内容复制粘贴在tmp.jsonl
中,并用python eval/eval_openfunction.py --input_file tmp.jsonl
进行了测试,输出与预期一致:
Accuracy for openfunction: 0 / 4 = 0.00%
是不是你在修改代码的过程中改变了该部分的评估逻辑?
但是这个prediction怎么会是毫无意义的字母拼接呢
可能是模型微调之后collapse了吧
我的train和test是相同的数据 o(≧口≦)o
可以检查一下数据集构造、超参数等方面是否存在问题,并结合微调中途的checkpoint、损失函数的曲线排查一下错误。
好的,谢谢您的建议,我再尝试尝试~
您好,有一个关于生成结果的问题。 result文件输出的结果如下: Fine-tuning using sdft
Evaluation on OpenFunctions: Accuracy for openfunction: 4 / 4 = 100.00%
prediction文件下的generated_predictions.jsonl的内容如下:
怎么会得到100%的准确率呢?