Closed Mickls closed 4 years ago
你好,README中为了简略描述大意,上面提供的例子是省略的,我的原文是:
docs = ["武磊威武,中超第一射手!",
"郜林看来不行,已经到上限了。",
"武球王威武,中超最强前锋!",
"武磊和郜林,谁是中国最好的前锋?"]
inv_index = ht.build_index(docs)
print(ht.get_entity_counts(docs, inv_index)) # 获得文档中所有实体的出现次数
# {'武磊': 3, '郜林': 2, '前锋': 2}
实际上这里已经假设运行了前面的例子中的这部分,登录了实体:
from harvesttext import HarvestText
ht = HarvestText()
entity_mention_dict = {'武磊': ['武磊', '武球王'], '郜林': ['郜林', '郜飞机'], '前锋': ['前锋'], '上海上港': ['上港'], '广州恒大': ['恒大'],
'单刀球': ['单刀']}
entity_type_dict = {'武磊': '球员', '郜林': '球员', '前锋': '位置', '上海上港': '球队', '广州恒大': '球队', '单刀球': '术语'}
ht.add_entities(entity_mention_dict, entity_type_dict)
想要实践具体用法的话,建议运行一下 examples/basics.py ,里面包括了几乎所有功能的,可以正常运行的用例
多谢解惑,我已经按照你所说的方式成功运行了,basics.py里面的例子非常好~
在readme中有一段例子如下
我按照例子的代码来做,得出的结果为空值,其中
inv_index
的值为{defaultdict:0}