lonePatient / BERT-NER-Pytorch

Chinese NER(Named Entity Recognition) using BERT(Softmax, CRF, Span)
MIT License
2.05k stars 425 forks source link

实体嵌套是只能解同类型的实体嵌套问题吗? #106

Open yuye2133 opened 4 months ago

yuye2133 commented 4 months ago
for subject in subjects:
    label = subject[0]
    start = subject[1]
    end = subject[2]
    start_ids[start] = label2id[label]
    end_ids[end] = label2id[label]
    subjects_id.append((label2id[label], start, end))

看这段代码,start_ids和end_ids都只有1份数据,所以一个字如果同时属于两种实体类型,会有一种被覆盖掉,比如:《苏轼传》,其中包含实体:苏轼【PER】,苏轼传【BOOK】,那么对于“苏”这个字,其实是否有两种状态的,因为第一种状态会被第二种状态覆盖 不知道是否理解正确