king-yyf / CMeKG_tools

MIT License
1.06k stars 400 forks source link

BUG:是否存在代码问题 #20

Open Mintyt opened 6 months ago

Mintyt commented 6 months ago

你好,我仔细看了一下您的代码,关于re有两点想讨论一下: 1、extract_spoes()函数中,L280-L291,我清晰你希望完成的是当同一输入文本中有多个主语定位词时遍历每一组,并在model4po模型中作为mask,与hidden_state进行叠加,希望在提取宾语与实体关系词时仅关注该主语起始位置,这样就免除了依存分析的内容。但是这一部分遍历只会取到第一组。只是因为在get_triples中用“。”切割,通常情况下一句只有一个主语,因此看起来表现是对的。 2、同上所述,在model4po模型定义时,看起来将s直接填充进了所有有效token对应的位置,all_s[b, :cue_len, :] = s,无法起到长文本的mask作用,这一步骤添加对第二段po提取的训练是无意义的。

Mintyt commented 6 months ago

我看起来是像要做多个主实体识别的,不然也不会在po模型中做一个类似mask的操作,只是不知道为什么您没有完整做出来。是多个主实体识别效果不好吗?