Open GoogleCodeExporter opened 8 years ago
现在的情况是这样的。我们用了:http://www.coreseek.cn 的版本。发现用了词表后 的结果效果不是很好。后来干脆用了字索引。效果还行。但�� �,search性能急剧下 降。所以,想用2元分词。但是发现,sphinx貌似没有实现,它� ��n-gram只支持0和1。 不知道,你这个版本可不可以支持2元分词。 2元分词的例子: 中华人民共和国 => 中华 华人 人民 民共 共和 和国
Original issue reported on code.google.com by ryanpoy@gmail.com on 21 Sep 2009 at 8:08
ryanpoy@gmail.com
sphinx-for-chinese还是基于sphinx的,目前还不支持2元切分。不过� ��合考虑,中文分词的效 果,比2元切分要好些
Original comment by blueflycn on 24 Sep 2009 at 9:01
blueflycn
Original issue reported on code.google.com by
ryanpoy@gmail.com
on 21 Sep 2009 at 8:08