xlxwalex / FCGEC

The Corpus & Code for EMNLP 2022 paper "FCGEC: Fine-Grained Corpus for Chinese Grammatical Error Correction" | FCGEC中文语法纠错语料及STG模型
https://aclanthology.org/2022.findings-emnlp.137
Apache License 2.0
104 stars 12 forks source link

测试集中的数据全部都是含有语法错误的句子还是有部分是正确的句子 #45

Open TLL1213 opened 5 hours ago

TLL1213 commented 5 hours ago

假设我的训练过程中只使用了错误的句子去训练,我提交到在线评测平台去测试,这是否合理,因为我想知道 测试集中包含了正确的句子吗

xlxwalex commented 5 hours ago

你好,

测试集中为了能够同时兼顾病句检测任务,所以是包含正确句子的,不过在Correction任务上会忽略Golden Label标注的正确句子,只会对病句样本进行比较计算指标,因此是合理的。