gitabtion / SoftMaskedBert-PyTorch

🙈 An unofficial implementation of SoftMaskedBert based on huggingface/transformers.
MIT License
93 stars 17 forks source link

关于在SIGHAN上的评测问题 #14

Closed so-coolboy closed 3 years ago

so-coolboy commented 3 years ago

大神您好,有一个问题想请教一下,原作者论文中提到用了两个数据集进行评估,一个是SIGHAN数据集,作者的测试集中也有1100个文本,但是给出的效果如下图红线:

Snipaste_2021-06-17_10-31-21

这和作者你给出的评估结果差距蛮大的,包括我查了一下SIGHAN数据集中给出的一些评测,貌似都达不到作者你的结果,代码我跑了一下,的确和作者你写的结果一致,所以我怀疑是不是评测的方法不一致导致的?

gitabtion commented 3 years ago

很抱歉现在才看到,我在做出该结果的时候也有过类似的怀疑,所以写了两种评测方式,一种是字级的一种是句级的,两种的都要比他们高,他们的这个结果个人认为主要有两个原因导致的:

  1. 训练数据不一样,我的额外训练数据是wang271k,而他们的是字节内部使用的纠错数据集,虽然说都与sighan的分布不一致,但可能wang271k的分布要更接近于sighan15一些。
  2. 复现问题,在复现的过程中,论文中未提及的细节我加入了一些自己理解,这也会对模型的表现造成差异。