RUCAIBox / RecSysDatasets

This is a repository of public data sources for Recommender Systems (RS).
https://recbole.io/
844 stars 132 forks source link

除movielens、IFM、Amazon外其他数据集KG构建 #102

Closed happy-xty closed 2 years ago

happy-xty commented 2 years ago

请问除movielens、IFM、Amazon外,其他数据集应该怎么构建KG呀?

Sherry-XLL commented 2 years ago

@happy-xty 您好,基于知识图谱的推荐系统获取数据集的常用方法主要有以下三种:

RecBole 采用的方式是第三种,所提供的知识图谱是基于 KB4Rec 中的方法,可以参考 KB4Rec 的论文repo

也就是说,对于其他推荐系统数据集,要想构造对应的知识图谱,首先需要取得推荐系统物品和知识图谱实体之间的映射链接。为了获取链接关系,可以将推荐系统平台收集的名称、类型、作者、年份等商品信息用作上下文特征。比如直接匹配商品名和知识图谱中的名称(YAGO),或者利用 Google 和 wikidata 提供的 API 接口,以商品名为 query,匹配外部 KG 中的 entity id。

常用的 API 接口有以下三种:

得到 item id 与 entity id 之间的映射关系之后,便可在大型知识图谱三元组中抽取推荐系统物品集对应的知识子图,一般只抽取物品集的一跳邻居,可以参考 KB4Rec 的代码部分

感谢您对 RecSysDatasets 的关注,在构造知识图谱的过程中有什么问题欢迎随时交流。

happy-xty commented 2 years ago

@Sherry-XLL 好哒,谢谢!