hankcs / hanlp-lucene-plugin

HanLP中文分词Lucene插件,支持包括Solr在内的基于Lucene的系统
http://www.hankcs.com/nlp/segment/full-text-retrieval-solr-integrated-hanlp-chinese-word-segmentation.html
Apache License 2.0
296 stars 99 forks source link

分詞問題 #23

Closed garrylam closed 7 years ago

garrylam commented 7 years ago

我是用 Solr 5.5 , “海明威”是人名, 而且在Hanlp 的 person/nrf.txt 中,

如果我 對”近看海明威” 分詞結果是: ”近/看/海明威” 但是對 ”走近海明威” 分詞結果是: ”走/近海/明/威"

通過運行test 碼,發現原來Hanlp-Lucene-plugin 用了 mini 字典, 可以用 hanlp.properties 去改變詞典的選擇。