stanleylsx / entity_extractor_by_ner

基于Tensorflow2.3开发的NER模型,都是CRF范式,包含Bilstm(IDCNN)-CRF、Bert-Bilstm(IDCNN)-CRF、Bert-CRF,可微调预训练模型,可对抗学习,用于命名实体识别,配置后可直接运行。
390 stars 73 forks source link

代码是否可以用在英文数据集上 #71

Closed niufendou closed 1 week ago

niufendou commented 4 months ago

我下载了英文的预训练bert模型,并且把我自己的英文数据集处理了格式之后,放上去训练结果全是0,是不支持英文吗 image

stanleylsx commented 1 week ago

我下载了英文的预训练bert模型,并且把我自己的英文数据集处理了格式之后,放上去训练结果全是0,是不支持英文吗 image

英文是支持的,不过你需要把英文的每个单词都标注成BIO格式才行,不过我建议使用https://github.com/stanleylsx/entity_extractor_by_pointer这个项目,标注格式没这么麻烦。