zzmjohn / mmseg4j

Automatically exported from code.google.com/p/mmseg4j
Apache License 2.0
0 stars 0 forks source link

希望可以在分词加入英文的小写 #6

Closed GoogleCodeExporter closed 9 years ago

GoogleCodeExporter commented 9 years ago

例如Kobe Bryant在分词后 kobe 不能搜索到结果 
Kobe可以,虽然这个是中文分词
法,但经常有中英混输的情况,如果在输入英文后,查不到��
�果,也是比较失望的,
另外我看了你的源代码,建议在词库的引进上采用单例模式��
�在web应用上会比较好,
谢谢你的帮助,另外我看了solol的mmseg的接口比较不错,你是�
��有意看看,另外再
次感谢你的solr分词

Original issue reported on code.google.com by futur...@gmail.com on 15 Aug 2009 at 6:37

GoogleCodeExporter commented 9 years ago
英文小写,好办,用 <filter class="solr.LowerCaseFilterFactory"/> 
就行,详情请
看:http://blog.chenlb.com/2009/04/solr-chinese-segment-mmseg4j-use-demo.html

solol 基本没看,我只是怕看了会影响我的设计思路。

也准备实现 http://chenlb.javaeye.com/blog/439843 提到的一些功能。

多谢你的关注。希望继续提出你的看法。

Original comment by chenlb2...@gmail.com on 17 Aug 2009 at 4:36

GoogleCodeExporter commented 9 years ago

Original comment by chenlb2...@gmail.com on 21 Oct 2009 at 3:10