Open li-aolong opened 5 years ago
需要进行正正规化
基于LM的GEC的定义特征之一是该方法不一定需要带注释的训练数据,本文关注以下错误类型:
一次迭代只能修改一个单词是因为相互影响
基于语言模型的无注释训练数据的GEC
1 简介
2 方法
2.1 序列概率
需要进行正正规化
2.2 混淆集合
基于LM的GEC的定义特征之一是该方法不一定需要带注释的训练数据,本文关注以下错误类型:
2.3 迭代
一次迭代只能修改一个单词是因为相互影响
3 数据和资源
微调
结果和讨论
结论