CLUEbenchmark / CLUE

中文语言理解测评基准 Chinese Language Understanding Evaluation Benchmark: datasets, baselines, pre-trained models, corpus and leaderboard
http://www.CLUEbenchmarks.com
4.02k stars 540 forks source link

请问分类任务上的所有评测得分都是用Acc吗 #76

Closed RyanHuangNLP closed 4 years ago

RyanHuangNLP commented 4 years ago

AFQMC:蚂蚁语义相似度(Acc);TNEWS:文本分类(Acc);IFLYTEK:长文本分类(Acc); CMNLI: 自然语言推理中文版; COPA: 因果推断; WSC: Winograd模式挑战中文版; CSL: 中国科学文献数据集

只有前三个任务说明得分是Acc,后面的任务是用什么得分呢,Acc or F1??

YC-wind commented 4 years ago

是的