ACL2020SpellGCN / SpellGCN

SpellGCN
https://arxiv.org/abs/2004.14166
241 stars 63 forks source link

数据集有轻微不一样 #4

Open YingZiqiang opened 4 years ago

YingZiqiang commented 4 years ago

您好,我查看了相应的数据集,论文中SIGHAN 2013 test set是1000条但是repo中只有998条,论文中train set有281379条但是repo中却刚好多了两条,为什么会这样?

wead-hsu commented 3 years ago

2013数据集中少两条主要是转换简体造成的。