lesamly / jcseg

Automatically exported from code.google.com/p/jcseg
0 stars 0 forks source link

很好的中文分词工具!想将贵工具用于我的推荐项目中的一些需求: (已解决) #6

Open GoogleCodeExporter opened 8 years ago

GoogleCodeExporter commented 8 years ago
很好的中文分词工具!我需要的4个功能都有!我需要实现:1
、分词;2、过滤停用词;3、同义词匹配(同义词库我可以自
己建立维护);4、能用于Lucene最新版本。试用很好很强大!

想将贵工具用于我的推荐项目中,还有几点个人需求:
1、汉字转数字(如千万->10000000)功能能否在配置文件中可关
闭。本项目中确实不需要。
2、配置文件jcseg.properties可否不必与JAR包在一起(可选)

另外还有一个疑问:
3、如果某个字不在lexicon词库中?当文档中出现这个字的时候
,运行代码是不是会出错?问这点我是考虑项目是否存在风��
�

Original issue reported on code.google.com by uu...@qq.com on 4 Jun 2013 at 2:54

GoogleCodeExporter commented 8 years ago
你好:

你这一说确实让我想起了几个存在的老问题, 
今早上发布1.8.2版的时候忘记修复了.

刚才发布了1.8.3版:

1. 加上了中文数字转阿拉伯数字的开关选项. 

2. jcseg.properties配置文件还支持classpath和user.home查找.

3. 在老版本的jcseg中, 
中文姓名识别中如果出现了词库中没有的词条确实会出现NullP
ointerException的bug. 1.8.3版已修复该问题.

感谢你的支持和关注.

Original comment by chenxin6...@gmail.com on 4 Jun 2013 at 7:46

GoogleCodeExporter commented 8 years ago
谢谢,呵呵!老朋友了!^_^

Original comment by uu...@qq.com on 4 Jun 2013 at 7:57

GoogleCodeExporter commented 8 years ago
更新详情: 
https://code.google.com/p/jcseg/wiki/AboutJcseg183?ts=1370332763&updated=AboutJc
seg183

哈哈, 其实我知道你是谁啦. ^_^

Original comment by chenxin6...@gmail.com on 4 Jun 2013 at 8:02

GoogleCodeExporter commented 8 years ago
关于中文分数转阿拉伯数字(如三分之一-->1/3)能否加上开��
�选项,因为符号“/”会造成Lucene cann't prase的问题

Original comment by uu...@qq.com on 5 Jun 2013 at 9:23

GoogleCodeExporter commented 8 years ago
感谢帮忙解决!经我测试已经OK!
而且分词效果和分词速度,我都相当满意!

Original comment by uu...@qq.com on 6 Jun 2013 at 2:44

GoogleCodeExporter commented 8 years ago
呵呵, 问题解决了就好. 也感谢你的反馈, 让jcseg成长了不少.

Original comment by chenxin6...@gmail.com on 6 Jun 2013 at 2:58