hankcs / HanLP

Natural Language Processing for the next decade. Tokenization, Part-of-Speech Tagging, Named Entity Recognition, Syntactic & Semantic Dependency Parsing, Document Classification
https://hanlp.hankcs.com/en/
Apache License 2.0
33.91k stars 10.15k forks source link

pyhanlp可以配置直接使用hanlp-portable-1.6.8.jar,而不需要hanlp.properties文件吗? #968

Closed whaozl closed 6 years ago

whaozl commented 6 years ago

注意事项

请确认下列注意事项:

版本号

当前最新版本号是:1.6.8 我使用的版本是:1.6.8

我的问题

我将pyhanlp安装后,把hanlp-1.6.8.jar用hanlp-portable-1.6.8.jar替换

但是依然需要hanlp.properties文件,可以直接和java一样使用快速版本吗?

然后用户通过加入词典直接更新hanlp-portable-1.6.8.jar里面的txt.bin文件即可?

恕我冒昧哈,提出这样的一个请求,里面pyhanlp代码好复杂,没怎么看懂
hankcs commented 6 years ago

需要,可以。 export HANLP_JAR_PATH=path/to/hanlp-portable-1.6.8.jar export HANLP_STATIC_ROOT= 你就可以脱离外部data了。 但jar包是个静态文件,不允许更新内部的bin。 portable是面向1、maven用户方便部署。2、给那些什么都不懂的懒人体验用的。 你的需求完全可以通过编辑配置文件做: CoreDictionaryPath=data/dictionary/CoreNatureDictionary.mini.txt BiGramDictionaryPath=... CustomDictionaryPath=... 或者HanLP.Config.CoreDictionaryPath=...

whaozl commented 6 years ago

太感谢hankcs了