Closed bojone closed 3 years ago
CLUE的github上给的各模型的成绩,不少都是偏低的,比如我自己用RoBERTa base可以将CHID做到0.86+,但github上给出的最好结果才0.85+。
所以公平起见,不建议直接引用上面写的成绩,而是用同样的微调脚本重测一遍RoBERTa。
感谢反馈,目前放出的模型还是比较早期的版本,内部模型还在迭代,后续我们更新模型版本的时候会参考您的建议。
CLUE的github上给的各模型的成绩,不少都是偏低的,比如我自己用RoBERTa base可以将CHID做到0.86+,但github上给出的最好结果才0.85+。
所以公平起见,不建议直接引用上面写的成绩,而是用同样的微调脚本重测一遍RoBERTa。