yeeeqichen / KGQA

基于知识图谱的问答系统设计与实现,附带一个可视化的demo
91 stars 16 forks source link

知识图谱数据集 #2

Open justyyau opened 2 years ago

justyyau commented 2 years ago

按照楼主给的链接去下载数据集,没有看到知识图谱的数据集,只看到了问答数据集

justyyau commented 2 years ago

想问下,知识图谱数据集在哪里下载

yeeeqichen commented 2 years ago

在google drive 上面除了1-hop、2-hop、3-hop和entity文件夹之外,还有一个kb.txt文件,可以从这个文件构建所需要的知识图谱。

google drive url: https://drive.google.com/drive/folders/0B-36Uca2AvwhTWVFSUZqRXVtbUE?resourcekey=0-kdv6ho5KcpEXdI2aUdLn_g

justyyau commented 2 years ago

好的,谢谢,还有个问题就是下面这些文件都是自己从下载的知识图谱数据集里面构建的吗 train2id.txt

yeeeqichen commented 2 years ago

嗯是的

justyyau commented 2 years ago

楼主我想问下,openke这个库是不是只能在linux系统下运行呀,

yeeeqichen commented 2 years ago

推荐在linux环境下使用,主要是编译

justyyau commented 2 years ago

嗯嗯,好的,谢谢

justyyau commented 2 years ago

是不是主要编译openke里面的这个呀,我是个小白有点不太懂 Compile C++ files


bash base.cpp
yeeeqichen commented 2 years ago

这是OpenKE 仓库的地址:https://github.com/thunlp/OpenKE

具体的使用步骤请参考仓库中README文件中的 Installation 部分

justyyau commented 2 years ago

好的,太感谢了

justyyau commented 2 years ago

Input Files Path : ./benchmarks/WN18RR/ The toolkit is importing datasets.

Process finished with exit code 139 (interrupted by signal 11: SIGS 想问下兄弟有没有出现个这个问题呀,调用openke得时候

LoneChristmas commented 1 year ago

请问可以指导一下如何划分test2id.txt,valid2id.txt,train2id.txt这三个文件吗?都是从kb.txt数据里面划分吗?有没有可以参考的方法?

Pzeyang commented 8 months ago

好的,谢谢,还有个问题就是下面这些文件都是自己从下载的知识图谱数据集里面构建的吗 train2id.txt

  • entity2id.txt
  • relation2id.txt
  • test2id.txt
  • valid2id.txt

您好,能说明下这几个怎么构建的吗

LoneChristmas commented 8 months ago

好的,谢谢,还有个问题就是下面这些文件都是自己从下载的知识图谱数据集里面构建的吗 train2id.txt

  • entity2id.txt
  • relation2id.txt
  • test2id.txt
  • valid2id.txt

您好,能说明下这几个怎么构建的吗

entity2id和relation2id这两个我是将kb.txt里面的entity和relation提取,再根据里面有一个kb_entity_dict将entity编码,(relation2id我忘了有没有已给出的编码,可以试试自己编),然后将kb.txt里面的三元组按照openke的格式要求划分为编码表示的三元组,再划分训练集、验证集和对照集(这三个集合的划分我是打乱后随便找了个比例,比如8:1:1,我也不是很懂要怎么划分)。至于工具的话我是自己写python脚本去构建这几个文件

Pzeyang commented 8 months ago

好的,我网上搜了一圈目前没看到将kG.txt写入neo4j的,我得先弄清楚KG.txt里面的实体对应哪个类型,好创建节点,关系 

@.***

 

------------------ 原始邮件 ------------------ 发件人: @.>; 发送时间: 2023年12月27日(星期三) 中午11:17 收件人: @.>; 抄送: @.>; @.>; 主题: Re: [yeeeqichen/KGQA] 知识图谱数据集 (#2)

好的,谢谢,还有个问题就是下面这些文件都是自己从下载的知识图谱数据集里面构建的吗 train2id.txt

entity2id.txt

relation2id.txt

test2id.txt

valid2id.txt

您好,能说明下这几个怎么构建的吗

entity2id和relation2id这两个我是将kb.txt里面的entity和relation提取,再根据里面有一个kb_entity_dict将entity编码,(relation2id我忘了有没有已给出的编码,可以试试自己编),然后将kb.txt里面的三元组按照openke的格式要求划分为编码表示的三元组,再划分训练集、验证集和对照集(这三个集合的划分我是打乱后随便找了个比例,比如8:1:1,我也不是很懂要怎么划分)。至于工具的话我是自己写python脚本去构建这几个文件

— Reply to this email directly, view it on GitHub, or unsubscribe. You are receiving this because you commented.Message ID: @.***>