Open lvmenglong opened 1 year ago
同学你好,感谢你对我们工作的关注。
早期的实体对齐工作从学术研究出发,数据集只考虑两个图谱是可以一对一对齐的,所以除去训练数据中的实体,剩下的实体都认为是有对齐的,也就是都可能有ref. alignment。
真实应用场景中有很多对齐任务不满足这个假设和设置,所以后续一些实体对齐工作开始考虑有的实体本身就没有对齐,比如DBP2.0数据集。在这种情况下,你的理解是对的,半监督选择新对齐的时候应该从全部候选实体里面选择。这个方向好像还没有工作来考虑,挑战性可能也比之前的数据集更大,可以探索一下。
谢谢。
您好,我对您提出的方法很感兴趣,我们复现了实验,发现自举过程是从ref_pairs中筛选新的对齐实体对,请问是否应该是从未对齐的实体中选择呢?