关于在SIGHAN上的评测问题

gitabtion / SoftMaskedBert-PyTorch

🙈 An unofficial implementation of SoftMaskedBert based on huggingface/transformers.

MIT License

93 stars 17 forks source link

很抱歉现在才看到，我在做出该结果的时候也有过类似的怀疑，所以写了两种评测方式，一种是字级的一种是句级的，两种的都要比他们高，他们的这个结果个人认为主要有两个原因导致的：

训练数据不一样，我的额外训练数据是wang271k，而他们的是字节内部使用的纠错数据集，虽然说都与sighan的分布不一致，但可能wang271k的分布要更接近于sighan15一些。
复现问题，在复现的过程中，论文中未提及的细节我加入了一些自己理解，这也会对模型的表现造成差异。

gitabtion / SoftMaskedBert-PyTorch