Closed ChangyuanWu closed 1 year ago
你好,最近我在用lm-evaluation-harness进行模型测评。 但是根据lm-evaluation-harness的task_table显示只有val集并且数量较少。请问如果我使用lm-evaluation-harness进行测评的时候,会使用test集的结果评估,还是val的结果评估?
由于lm-evaluation-harness需要公开答案,因此我们使用的是val集。谢谢
你好,最近我在用lm-evaluation-harness进行模型测评。 但是根据lm-evaluation-harness的task_table显示只有val集并且数量较少。请问如果我使用lm-evaluation-harness进行测评的时候,会使用test集的结果评估,还是val的结果评估?