Open GoogleCodeExporter opened 8 years ago
哈,这个不是bug。
默认情况下jcseg的停止词过滤功能是开启的,这个在检索领域
很有作用。
如果你不需要这个功能,在jcseg.properties配置文件中配置jcseg.c
learstopword=0来关闭该功能。
感谢你的反馈。
Original comment by chenxin6...@gmail.com
on 24 Jul 2013 at 10:56
哈哈 谢谢你的回复,已经了解了,这个分词确实不错。
Original comment by qindg...@gmail.com
on 28 Jul 2013 at 2:38
另外提一个问题哈,针对多音字的情况
比如:单田芳,加载出来后,拼音为:dan tian fang
Original comment by qindg...@gmail.com
on 28 Jul 2013 at 2:42
这个是姓名识别功能切分出来的组合词,词的拼音是根据词��
�处理的。并没有考虑多音字,毕竟jcseg主要重点在分词。
解决办法:
将这个词单独作为一个词条放入到CJK_WORDS主词库,然后加上��
�确的拼音即可。
Original comment by chenxin6...@gmail.com
on 28 Jul 2013 at 4:01
Original issue reported on code.google.com by
qindg...@gmail.com
on 23 Jul 2013 at 3:32