lixiang0 / WEB_KG

爬取百度百科中文页面,抽取三元组信息,构建中文知识图谱
http://kg.rubenxiao.com
937 stars 189 forks source link
baidu baike knowledge-graph neo4j nlp spider wiki

开源web知识图谱项目

update 20200720

Windows上的部署参考如何在Windows上部署,感谢LMY-nlp0701!

update 20191121
Tips

环境

代码执行:

cd WEB_KG/baike
scrapy crawl baike

执行界面(按ctrl+c停止):

知识图谱效果图

mongodb存储的网页内容

mongodb存储的三元组

neo4j后台界面