xlxwalex / FCGEC

The Corpus & Code for EMNLP 2022 paper "FCGEC: Fine-Grained Corpus for Chinese Grammatical Error Correction" | FCGEC中文语法纠错语料及STG模型
https://aclanthology.org/2022.findings-emnlp.137
Apache License 2.0
108 stars 12 forks source link

数据问题 #6

Closed nghuyong closed 1 year ago

nghuyong commented 1 year ago
image

train.json里面的这句话error_flag=1, 但是op是空,是没错吗?

xlxwalex commented 1 year ago

您好, 感谢您的反馈!该句确实是非病句。标签的错误里是因为现在仓库中的Train文件版本有误,可能是拖到仓库目录的时候错选了版本(该版本为中间过程的文件,其中没有包含error_flag=0也即正确句子的样本),我一会再核对一次会覆盖一个最终版的数据,再次感谢您的反馈!!另Valid和Test目前已核对没有问题,等上传后我会在这里回复。

xlxwalex commented 1 year ago

您好,新的训练集我已上传,请您再拉取一次!

nghuyong commented 1 year ago

收到,感谢