Closed skyrusai closed 6 years ago
问题 1: 貌似 停用词词典不支持配置多个路径,你可以指定单个文件试一下。
问题 2:
你的 上海地名.txt ns
是不是配置有问题;此外 my.txt; feature_dict.txt;
这两个文件的目录需要在data/dictionary/custom/
下面。
hanlp -v
获取hanlp.properties的路径,修改CustomDictionaryPath=data/dictionary/custom/CustomDictionary.txt; my.txt; 全国地名大全.txt ns;data/dictionary/person/nrf.txt nr;
注意放到CustomDictionary.txt;
的后面,加空格,加英文分号结束。
这里面的地址和斜杠的顺序有关系么,导致读不到。
没关系,你应该检查是否编辑了正确的配置文件,site-packages\pyhanlp\static下面有hanlp.properties和hanlp.properties.in,第一个才是正确的配置文件。你需要显示文件拓展名。
隔了几天,又跑了下代码,没问题了,感谢大佬耐心解答
注意事项
请确认下列注意事项:
版本号
pyhanlp 当前最新版本号是:1.6.8 我使用的版本是:1.6.8
我的问题
stopwords 能不能自定义文件 print(HanLP.Config.CoreStopWordDictionaryPath) /home/q/pyhanlp/data/dictionary/stopwords.txt; stop_dict.txt; 能不能这样配置 这样配置,下面这段代码会报错,也就是不能这样配置吗?
from pyhanlp import * NotionalTokenizer = JClass("com.hankcs.hanlp.tokenizer.NotionalTokenizer") text = "小区居民有的反对喂养流浪猫,而有的居民却赞成喂养这些小宝贝" print(NotionalTokenizer.segment(text))
java.lang.NullPointerExceptionPyRaisable Traceback (most recent call last)