Closed ray075hl closed 9 months ago
https://qwenlm.github.io/zh/blog/qwen1.5/ 作者您好,我看到qwen1.5-7B在c-eval上的得分是74.1, 而TigerBot 70B在c-eval上只有60.04。 这是为什么呢?
大模型评测本身是个开放问题,我们更关注应用效果。
@chentigerye 感谢大佬的回复,也就是说我们应该测评模型的应用场景对吧。
https://qwenlm.github.io/zh/blog/qwen1.5/ 作者您好,我看到qwen1.5-7B在c-eval上的得分是74.1, 而TigerBot 70B在c-eval上只有60.04。 这是为什么呢?