hankcs / HanLP

中文分词 词性标注 命名实体识别 依存句法分析 成分句法分析 语义依存分析 语义角色标注 指代消解 风格转换 语义相似度 新词发现 关键词短语提取 自动摘要 文本分类聚类 拼音简繁转换 自然语言处理
https://hanlp.hankcs.com/
Apache License 2.0
33.84k stars 10.12k forks source link

自定义词典强制模式不起作用 #1772

Closed PsyQuant closed 2 years ago

PsyQuant commented 2 years ago

Describe the bug 添加自定义词典,强制模式不起作用

Code to reproduce the issue Provide a reproducible test case that is the bare minimum necessary to generate the problem.

import hanlp
HanLP = hanlp.load(“component”)
text = “海航haihangMU3456航班”
HanLP.dict_force = {“haihang”}
print("-->", HanLP([text])[“tok/fine”])
--> [[‘海航’, ‘haihangMU3456’, ‘航班’]]

System information

hankcs commented 2 years ago

你需要操作分词任务的属性,而不是MTL。

https://github.com/hankcs/HanLP/blob/b74d4ff1db9ad4c9aea5140db0b5a4be59e34c7b/plugins/hanlp_demo/hanlp_demo/zh/demo_custom_dict.py#L11