xiangking / ark-nlp

A private nlp coding package, which quickly implements the SOTA solutions.
Apache License 2.0
310 stars 65 forks source link

非连续实体问题 #86

Open fjw1049 opened 4 months ago

fjw1049 commented 4 months ago

您好,非连续实体这里有什么比较好的算法可以支持吗,输入的数据格式是什么呢

jimme0421 commented 4 months ago

W^2NER可以支持非连续实体,不过受顺序限制,具体的可以看论文

数据格式和连续实体一致,统一在 dataset 模块处理,可以参考w2ner_named_entity_recognition_dataset.py

p.s. 实现的版本比较老了,可以参考github重写一下。