v-mipeng / LexiconAugmentedNER

Reject complicated operations for incorporating lexicon for Chinese NER.
436 stars 66 forks source link

代码无法达到论文的水平 #25

Open jugechengzi opened 3 years ago

jugechengzi commented 3 years ago

你好,我用了你的代码在weibo和Resume上进行了测试,结果并没有论文中的那么高,请问是什么原因呢。 结果如下:save_model/Weibo Best dev score: p:0.7023121387283237, r:0.6246786632390745, f:0.6612244897959183

Test score: p:0.6656534954407295, r:0.5289855072463768, f:0.5895020188425303

save_model/Resume Best dev score: p:0.9511705685618729, r:0.9498997995991983, f:0.9505347593582887

Test score: p:0.9524984577421345, r:0.947239263803681, f:0.9498615810519839

在微博上f是58.95,resume则为94.99,论文中分别为61.42和95.53.

我对代码修改的地方又两点,第一是将mask的.byte()的tensor全部改为了.bool() 第二是代码中的原始数据集指示路径为.CNNER/data/……,但是实际上下载的代码是没有.CNNER目录的,我修改为了./data/……

如果能抽空指教,将不胜感激,谢谢!

lqqdeyhm commented 3 years ago

我也想请教这个问题,Weibo数据集采用更新后数据集;参数设置为dropout=0.1;hidden_size=100;lr=0.005;取前30个epoch的结果,最后P = 65.83,R=50.72, F=57.30,其中P值过高,另外两个都低。不知道你有没有使用bert,或者biword,char 的embedding呢?

jugechengzi commented 3 years ago

没有bert和bichar,就是普通的条件,可能是随机种子的原因,更换随机种子可以得到不同的结果,但是我还没有达到论文描述的水平