在某公司参与的语知识图谱相关的代码和个人整理的数据,数据全部是公开数据与原公司无关
KnowledegGraph
该文件夹是在处理有关知识图谱相关内容的代码和数据
2.1. code
该文件夹生成知识图谱相关的代码
2.2.1 add_taboo.py
在知识图谱中添加禁忌关系代码
2.2.2 baiduAPI.py
尝试使用百度的句法分析的代码,只做了尝试,没有进一步深入
2.2.3 create_graph.py
构建知识图谱类
2.2.4 DingDangKGdemo_main.py
叮当用药知识图谱运行主文件
2.2.5 get_BIESO_based_rule.py
对数据基于字典进行BIESO标注
2.2.6 get_entity_relationship_from_xunyiwenyao.py
从寻医问药的数据中抽取出先关的实体和关系保存在文件中
2.2.7 get_level.py
从层级结构中抽取层级关系并直接添加在知识图谱中
2.2.8 HaoXinQingKGdemo_main.py
好心情知识图谱运行主文件
2.2.9 neo4j.py
在寻医问药知识图谱中有关neo4j数据库相关的代码
2.2.10 utils.py
一些用过的,但是不知道放哪的代码,
2.2.11 XunYiWenYaoKGdemo_main.py
寻医问药知识图谱运行主文件
2.3 data
在知识图谱运行中使用的数据
2.3.1 dict
在知识图谱中使用的标准字典,从原始数据中复制过来的
2.3.2 dingdangkuaiyao
在知识图谱中使用叮当快药的相关数据
2.3.3 haoxinqing
好心情的相关数据
2.3.4 medicine_level
药物层级关系的相关数据
2.3.5 symptom_lead_disease
抽取出来的症状疾病层级结构数据
2.3.6 xunyiwenyao
寻医问药的相关数据
2.4 neo4j-community-3.5.5.zip
neo4j数据库本体文件
2.5 生成文件
从code代码中生成的文件,有些生成文件在后续的代码中也会被用到,看名字就可以区分开
3.原始数据
该文件夹是和知识图谱可能相关的全部原始数据
3.1 ATC
ATC编码,药物的层级结构,更加偏向于药物在使用中的分级
3.2 ICD10
疾病的ICD10 编码,中文的
3.3 stopwords
停用词,中英文
3.4 中医妇科学
中医妇科学的相关数据,从中医妇科学这本书获得
3.5 临床药物手册数据
临床用药数据,药物的层级结构,和ATC有重合
3.6 原始词典/标准词典
经过人工处理的原始词典/标准词典,标注词典处理了一部分错误,但是仍要需要在进一步清洗
3.7 叮当快药
叮当快药相关的数据
3.8 国家基本药物目录2018版
国家基本药物目录数据,也是药物的层级结构
3.9 好心情
好心情的相关数据
3.10 寻医问药网站数据
从寻医问药网站获得数据
3.11 情感词汇本体/知网情感词典sentiment
有关情感的本体词汇
3.12 求医网
求医网的相关数据,在此使用了疾病和症状的层级结构