belikemike23 / jcseg

Automatically exported from code.google.com/p/jcseg
0 stars 0 forks source link

关于词库管理的小建议 (已解决) #15

Open GoogleCodeExporter opened 9 years ago

GoogleCodeExporter commented 9 years ago
用了几个分词器,效果不理想,最后还是找到这个分词器,��
�果不错,感谢作者的贡献,在使用过程中,想到有一点建议�
��
配置文件中词库路径能不能支持多个路径的载入?这样可以��
�便一点点词库的规划
自动重载词库能不能支持正则表达式匹配词库文件载入?

非常感谢作者贡献这么好的分词器d=(´▽`)=b

Original issue reported on code.google.com by thunderb...@gmail.com on 29 Nov 2013 at 2:08

GoogleCodeExporter commented 9 years ago
1. 
配置文件只是方便初始化,简化工作。jcseg提供了对应的API来
指定从对应的文件或者目录加载词库。 
自主开发的话可以很好的解决这个问题。。。

2. 词库的重载支持正则, 这个想法挺好的。

我会加载下期的版本中加入你说的这些功能,感谢你的反馈��
�

也感谢你的夸奖。。。。

Original comment by chenxin6...@gmail.com on 29 Nov 2013 at 2:04

GoogleCodeExporter commented 9 years ago
还有一个问题,就是那个在core里面的ADictionary这个类里面的lo
adWordFromFile的方法,有几个个这样的判断if ( 
config.LOAD_CJK_PINYIN && ! "null".equals(wd[2]) ) 建议加上非空判断if ( 
config.LOAD_CJK_PINYIN && wd[2]!=null &&! "null".equals(wd[2]) ) 
不知道是不是编译的问题(建议最好在说明写上编译版本)��
�我载入词库的时候总是说有转换Int异常,应该是335行那里的�
��题,但是MyEclipse不能够追踪到代码行数(TOT),我将源��
�加上空判断之后编译就跑过了
( ゚∀゚)アハハ

Original comment by thunderb...@gmail.com on 2 Dec 2013 at 3:45

GoogleCodeExporter commented 9 years ago
@thunderbird.shun

你自定义的词库吧. 自定义的词库注意词库的格式.

我起初的想法是: 如果出错了, 会影响词库的加载, 
与其屏蔽掉这种错误, 不如让其暴露出来, 
让开发者明白发生了什么事情.

感谢你的建议, 下个版本加入更友好的提示...

Original comment by chenxin6...@gmail.com on 3 Dec 2013 at 1:46