zjunlp / DeepKE

[EMNLP 2022] An Open Toolkit for Knowledge Graph Extraction and Construction
http://deepke.zjukg.cn/
MIT License
3.54k stars 685 forks source link

关于re 文档级别抽取预测结果的问题 #530

Closed Danmo121 closed 4 months ago

Danmo121 commented 4 months ago
  1. 我使用现有的英文数据进行训练,在使用test数据结果预测时,结果中只有: "title": , "h_idx": , "t_idx": , "r": "", 但是没有evidence或者sent id,正常应该是得有evidence吧。请赐教,谢谢! Snipaste_2024-06-14_00-09-17
  2. 另外还有一个问题请教,在train.yaml文件中,有这两个参数: num_class: 97 num_labels: 4 其中,num_class代表了关系种类的数量,那么num_labels是什么的数量,有点不太明白,谢谢!
zxlzr commented 4 months ago

您好,请问您使用的是deepke中哪个方法?麻烦您提供一些细节便于我们帮助您

Danmo121 commented 4 months ago

您好,请问您使用的是deepke中哪个方法?麻烦您提供一些细节便于我们帮助您 您好,就是使用re中DeepKE\example\re\document 篇章级别的关系抽取方法,就是使用咱们提供的DocRED数据。也是按照现有的代码正常训练和预测的。

njcx-ai commented 4 months ago

您好,非常感谢您对我们工作的关注。

  1. test数据结果预测的是实体对之间的关系,这里应该不涉及sent_id。
  2. num_class代表了关系种类的数量,num_labels表示的应该是论文中公式10-11中的balanced softmax类别,您可以在源码里看一下具体细节。
Danmo121 commented 4 months ago

感谢解答,关于num_labels我明白了,看了一下h_idx是头实体,t_idx是尾实体,r是关系。h_idx t_idx是指在vertexSet中的索引,之前误认为是pos[]了。再次感谢