hankcs / hanlp-lucene-plugin

HanLP中文分词Lucene插件,支持包括Solr在内的基于Lucene的系统
http://www.hankcs.com/nlp/segment/full-text-retrieval-solr-integrated-hanlp-chinese-word-segmentation.html
Apache License 2.0
296 stars 99 forks source link

修正更多分隔符造成的特殊分词器异常 #38

Closed AnyListen closed 6 years ago

AnyListen commented 6 years ago

更新内容:

  1. 根据 IDEA 的建议对 PorterStemmer.java 进行简单优化;
  2. 添加了 Email 提取分词器,并添加了其测试代码;
  3. 指定分隔符对句子进行切分。
hankcs commented 6 years ago

谢谢!