open-compass / opencompass

OpenCompass is an LLM evaluation platform, supporting a wide range of models (Llama3, Mistral, InternLM2,GPT-4,LLaMa2, Qwen,GLM, Claude, etc) over 100+ datasets.
https://opencompass.org.cn/
Apache License 2.0
4.22k stars 449 forks source link

您好,请问L-Eval的主观题最终得分是使用rougeLsum这个分数吗?还有就是L-Eval数据集缺少了codeU和sci_fi有相关的评测配置文件么? #1721

Open 13416157913 opened 3 days ago

13416157913 commented 3 days ago

Prerequisite

Type

I'm evaluating with the officially supported tasks/models/datasets.

Environment

您好,请问L-Eval的主观题最终得分是使用rougeLsum这个分数吗?还有就是L-Eval数据集缺少了codeU和sci_fi有相关的评测配置文件么? image

Reproduces the problem - code/configuration sample

您好,请问L-Eval的主观题最终得分是使用rougeLsum这个分数吗?还有就是L-Eval数据集缺少了codeU和sci_fi有相关的评测配置文件么? image

Reproduces the problem - command or script

您好,请问L-Eval的主观题最终得分是使用rougeLsum这个分数吗?还有就是L-Eval数据集缺少了codeU和sci_fi有相关的评测配置文件么? image

Reproduces the problem - error message

您好,请问L-Eval的主观题最终得分是使用rougeLsum这个分数吗?还有就是L-Eval数据集缺少了codeU和sci_fi有相关的评测配置文件么? image

Other information

您好,请问L-Eval的主观题最终得分是使用rougeLsum这个分数吗?还有就是L-Eval数据集缺少了codeU和sci_fi有相关的评测配置文件么? image