crownpku / Information-Extraction-Chinese

Chinese Named Entity Recognition with IDCNN/biLSTM+CRF, and Relation Extraction with biGRU+2ATT 中文实体识别与关系提取
2.22k stars 813 forks source link

【seg_features】的长度问题 #131

Open ztang07 opened 3 years ago

ztang07 commented 3 years ago

image

如图所示,segs的长度会按照句子的字长度进行padding,但是segs基于原句子进行分词,其长度索引并不能直接对应原句子的字。 比如,segs[0]可能对应原句子中的chars[0] + chars[1] + chars[2],这样经过模型的建模之后对应位置的logits好像有影响,decode时,该位置索引的logits从直观上看起来并不直接对应原来这个位置的某个字。