zzmjohn / mmseg4j

Automatically exported from code.google.com/p/mmseg4j
Apache License 2.0
0 stars 0 forks source link

添加针对身份证号,手机号级汽车牌号等特殊字段的一元分词 #25

Open GoogleCodeExporter opened 9 years ago

GoogleCodeExporter commented 9 years ago
您好:
     使用mmseg4j分词,感觉很不错,mmseg4j能不能添加这样一种功能,:就是添加一种分词模式:针对身份证号,手机号以及汽车牌号等特殊字段进行一元分词,这样我在搜索的时候,只要输入其中相连的一段数字 或者 京B3 等就能查询出需要的结果(高亮显示)。
自己尝试着改写mmseg4j以及solr的一些分词法,功能是实现了,
但是不理想,当数据达到亿级以上时,查询速度就很慢。

联系方式:jiangyad@sina.com

Original issue reported on code.google.com by jiang...@sina.com on 19 Mar 2012 at 3:36

GoogleCodeExporter commented 9 years ago
这需求也多,考虑实现一下。

Original comment by chenlb2...@gmail.com on 1 Apr 2012 at 9:22