taishan1994 / BERT-BILSTM-CRF

使用BERT-BILSTM-CRF进行中文命名实体识别。
291 stars 32 forks source link

修改为处理英文数据模型,性能不佳 #21

Open fuling00 opened 3 months ago

fuling00 commented 3 months ago

大佬好,借助gpt,我将您的模型修改为处理英文数据的模型, 使用公开英文数据集,这个性能在80左右,使用W2NER模型性能在90左右, 一般论文里提到,使用该模型最高性能在94左右,是超参数设置问题,还是我修改原模型原因, 处理英文数据时,使用的预训练模型是bert-base-cased,跟预训练模型的选择也有关系嘛 希望大佬帮忙解答下,在此非常感谢!

taishan1994 commented 3 months ago

换成英文的话需要对齐英文token和标签,要重新处理下。

fuling00 commented 3 months ago

已对英文token和标签进行修改,性能仍在80左右