CLUEbenchmark / CLUE

中文语言理解测评基准 Chinese Language Understanding Evaluation Benchmark: datasets, baselines, pre-trained models, corpus and leaderboard
http://www.CLUEbenchmarks.com
4k stars 540 forks source link

c3任务数据处理问题 #140

Open ztl-35 opened 2 years ago

ztl-35 commented 2 years ago

你好,关于c3任务有两个问题,(1)对于test数据处理是c3-d-test.json命名,但是下载的C3数据是没有这个test文件的,只有test1.0.json和test1.1.json,具体代码问题参考下面图片。(2)为什么在test数据集上有answer部分的处理逻辑,test部分要submit到网站,下载每个sample有context,question和choice,如果后面要转化label,会报错。谢谢! 9FDEEFBD-BB3F-4C70-9350-A04E3CA65C6E A89C03B3-B9ED-471A-B8DA-1B5991599E99

brightmart commented 2 years ago

收到问题

ewrfcas commented 2 years ago

https://github.com/nlpdata/c3 可以到这里下载对应测试集

ztl-35 commented 2 years ago

https://github.com/nlpdata/c3 可以到这里下载对应测试集

好的谢谢!

ztl-35 commented 2 years ago

你好,关于C3最后提交的数据格式,目前的程序可能还有问题。run_c3.py最后保存的submission_test.json和下载的c311提交样例格式不一样。 submission_test.json输出格式如下: 520653AB-28A4-4B1A-BAEC-4C003C425CF6

c311提交样例格式如下: EE2409D6-17FC-4D75-B281-1DC905443D71

我看test_loader是顺序加载和预测的,那我是不是按照顺序转换一下生成的submission json就可以了呢?谢谢!

ewrfcas commented 2 years ago

是的

ztl-35 commented 2 years ago

好的谢谢!

ztl-35 commented 2 years ago

你好,按照上面的方法提交的结果,网站显示为0。我重新修改了程序,将test.json的数据处理逻辑改了一下,用原来下载的数据提交上去,结果是正常的。建议将test数据处理逻辑在程序里面改一下,适配现在下载的test.json

kisseternity commented 1 year ago

你好,按照上面的方法提交的结果,网站显示为0。我重新修改了程序,将test.json的数据处理逻辑改了一下,用原来下载的数据提交上去,结果是正常的。建议将test数据处理逻辑在程序里面改一下,适配现在下载的test.json

哈喽,请问是要处理成类似下面这种格式提交吗?我每次提交总是分数不对 {"id": 0, "label": "0"} {"id": 1, "label": "1"} {"id": 2, "label": "1"} {"id": 3, "label": "1"} {"id": 4, "label": "1"} {"id": 5, "label": "3"}