Open starplatinum3 opened 4 months ago
参考项目论文实验的Evaluation Metrics部分,封闭式选择题就是算准确度,开放式的题目用GPT4判断两两模型间谁的回答更优秀,计算每个模型的胜出率
参考项目论文实验的Evaluation Metrics部分,封闭式选择题就是算准确度,开放式的题目用GPT4判断两两模型间谁的回答更优秀,计算每个模型的胜出率