CLUEbenchmark / CLUE

中文语言理解测评基准 Chinese Language Understanding Evaluation Benchmark: datasets, baselines, pre-trained models, corpus and leaderboard
http://www.CLUEbenchmarks.com
4.02k stars 540 forks source link

排行榜很多问题 #121

Closed beyondguo closed 3 years ago

beyondguo commented 3 years ago
  1. 可以增加一个搜索功能吗?或者按照提交时间排序。不然有些提交的结果都找不到。
  2. 今天发现分类排行榜的后面至少几十页,全部都是垃圾提交,模型名全部是随机字母,得分完全一样。
  3. 发现如果模型重名了,新提交的结果如果某一个数据集没使用,就会把之前的结果给清空。
brightmart commented 3 years ago

这些应该都是使用体验的我那天。收到反馈。 可以我们最近先把部分明显无效的提交移除;

brightmart commented 3 years ago

已经把无效提交移除啦,现在比较清爽一些了。