xlxwalex / FCGEC

The Corpus & Code for EMNLP 2022 paper "FCGEC: Fine-Grained Corpus for Chinese Grammatical Error Correction" | FCGEC中文语法纠错语料及STG模型
https://aclanthology.org/2022.findings-emnlp.137
Apache License 2.0
108 stars 12 forks source link

模型的纠错能力 #23

Closed zbpjlc closed 1 year ago

zbpjlc commented 1 year ago

当我使用inference_singleline.py时,如果我随便输入一些词,基本上都是返回原句子。 Input the incorrect sentence (q for quit):我爱李

corrected sentence: 我爱李

Input the incorrect sentence (q for quit):我爱北京天是安门

corrected sentence: 我爱北京天是安门。

xlxwalex commented 1 year ago

你好,

你的这些例子感觉更偏向于Spell类型的错误,我们的训练数据集FCGEC更倾向于语义类型的错误。由于STG仅在FCGEC上训练,因此其本身不太会具有修改你所述样本错误的能力。

如果需要修改你所述样本,最好使用Spell数据对模型进行训练后再进行测试