Open li-aolong opened 5 years ago
NLPCC 2018 GEC 训练集(http://tcci.ccf.org.cn/conference/2018/taskdata.php)来自于 NLPCC 2018 GEC 共享任务测评,官方数据的原始格式为:
样例:
1 1 我在家里一个人学习中文。 我在家里自学中文。 2 0 我是里阿德,来自以色列。 1 3 这个软件让我们什么有趣的事都记录。 这个软件讓我们能把任何有趣的事都记录下來。 这个软件能让我们把有趣的事都记录下来。 这个软件能让我们把任何有趣的事都记录。 1 1 两位易知基金代表访白目的为连接两国高等院校。 两位易知基金代表访白目的为开展两国高等院校的合作。
各字段含义:
NLPCC 2018 GEC
NLPCC 2018 GEC 训练集(http://tcci.ccf.org.cn/conference/2018/taskdata.php)来自于 NLPCC 2018 GEC 共享任务测评,官方数据的原始格式为:
样例:
各字段含义:
lang8
汉语水平考试(HSK)
seq2seq_attention模型
维基百科中文语料