nju-websoft / OpenEA

A Benchmarking Study of Embedding-based Entity Alignment for Knowledge Graphs, VLDB 2020
GNU General Public License v3.0
522 stars 81 forks source link

关于数据集的问题 #36

Open JohnCoffie opened 2 years ago

JohnCoffie commented 2 years ago

作者,您好!我是一名刚接触知识图谱的小白,特别是实体融合这块领域,我们有幸搜到您提供的工具,但是我们水平很低,对于数据集这块我们有一个困惑,我们是不是数据集必须是一个一个标签页面,比如html或者xml?我们现实的需求其实是把两个相似的实体归类到一类本地下,例如梅西和C罗,都属于球员这个本地。请问我们应该怎么准备这个数据集呢?是不是我们需要事先生成一个个网页?格式是不是自定义?或者我们也可以直接使用一段文本作为数据集?问题很粗浅,还请您见谅。

sunzequn commented 2 years ago

你好,很抱歉回复晚了。把数据整理成三元组的形式,比如(梅西 职业 足球运动员),就可以用知识图谱表示学习这边的算法和工具了。具体的话,你看看参考你想用的那个算法或者工具的数据集的格式。