wangle1218 / KBQA-for-Diagnosis

Knowledge Graph,Question Answering System,基于知识图谱和向量检索的医疗诊断问答系统
1.33k stars 380 forks source link

实体链接和实体规范化 #3

Open wenjiechen0913 opened 3 years ago

wenjiechen0913 commented 3 years ago

我之前看论文都说实体规范化也叫实体链接,您说规范化是实体链接的一部分,有点豁然开朗,十分感谢,观看您的视频好几遍。 您这个实体规范化有点类似于文本匹配,mention和entity都是sentence,训练数据是二分类,label是0或者1,如果我想规范化为一个知识库上的唯一id该怎么做呢,怎么构建这训练数据。我根据UMLS构建了一个实体字典,想做实体规范化,根据mention和知识库字典上的实体相似度匹配,指向知识库上唯一的id,感觉您这个问题跟我相似(相似度匹配排序)又有点不相似,我知识库类似于一个同义词表,不知道如何解决这个问题,还是说我这种想法是实体链接问题,感觉想用我数据试试都不知道如何改变我的数据,能否解答一下,万分感谢!

wangle1218 commented 3 years ago

我之前看论文都说实体规范化也叫实体链接,您说规范化是实体链接的一部分,有点豁然开朗,十分感谢,观看您的视频好几遍。 您这个实体规范化有点类似于文本匹配,mention和entity都是sentence,训练数据是二分类,label是0或者1,如果我想规范化为一个知识库上的唯一id该怎么做呢,怎么构建这训练数据。我根据UMLS构建了一个实体字典,想做实体规范化,根据mention和知识库字典上的实体相似度匹配,指向知识库上唯一的id,感觉您这个问题跟我相似(相似度匹配排序)又有点不相似,我知识库类似于一个同义词表,不知道如何解决这个问题,还是说我这种想法是实体链接问题,感觉想用我数据试试都不知道如何改变我的数据,能否解答一下,万分感谢!

不管是规范化还是实体链接,目的都是判断mention和知识库中的哪个知识(唯一实体、节点、id)相同;实体规范化做的只是实体名称称谓的匹配,实体链指不光做这个,还需要在语义上做匹配,比如“苹果”这个mention已经不需要做名称称谓的规范化了,但是应该和知识库中的“苹果(手机品牌)”和“苹果(水果)”哪个实体相匹配呢,这还需要做实体的语义消歧(实体消歧)。 不管你知识库有什么,你要做规范化也好,链指也好,目的都是需要将mention和那个标准的“实体”匹配,和其他同义词没关系;当然你可以利用同义词和其标准词去构建一一配对的训练正样本。如果你的UMLS实体字典只有实体名称或都同属于相同的实体label那就是实体规范化,否则就是实体链指(实体属性上也要匹配)。