li-aolong / li-aolong.github.io

李傲龍的博客
https://aolong.me
82 stars 16 forks source link

7.22——文献阅读《Language Model Based Grammatical Error Correction without Annotated Training Data》 #9

Open li-aolong opened 5 years ago

li-aolong commented 5 years ago

基于语言模型的无注释训练数据的GEC

1 简介

2 方法

2.1 序列概率

需要进行正正规化

2.2 混淆集合

基于LM的GEC的定义特征之一是该方法不一定需要带注释的训练数据,本文关注以下错误类型:

2.3 迭代

一次迭代只能修改一个单词是因为相互影响

3 数据和资源

微调

结果和讨论

结论