liuhuanyong / QASystemOnMedicalKG

A tutorial and implement of disease centered Medical knowledge graph and qa system based on it。知识图谱构建,自动问答,基于kg的自动问答。以疾病为中心的一定规模医药领域知识图谱,并以该知识图谱完成自动问答与分析服务。
6.41k stars 2.17k forks source link

prepare_data文件中的max_cut.py完全没用,可以删除! #57

Open Peace-And-War opened 2 years ago

Peace-And-War commented 2 years ago

max_cut.py主要是为了解决爬取数据中的"basic_info"中的"并发症"数据连在一起无法分离的问题。但问题应该出在data_spider.py中,而不是应该用max_cut.py使问题复杂化。作者使用的max_cut.py增加了操作步骤而且错误率不低。在data_spider.py,加入accompany = selector.xpath('//div[@class="mt20 articl-know" and position() = 2]/p/span/a/text()')就可以完美解决问题,整个max_cut.py就不需要了。