cysin / sphinx-for-chinese

Automatically exported from code.google.com/p/sphinx-for-chinese
0 stars 0 forks source link

支持2元分词么? #3

Open GoogleCodeExporter opened 9 years ago

GoogleCodeExporter commented 9 years ago
现在的情况是这样的。我们用了:http://www.coreseek.cn 
的版本。发现用了词表后
的结果效果不是很好。后来干脆用了字索引。效果还行。但��
�,search性能急剧下
降。所以,想用2元分词。但是发现,sphinx貌似没有实现,它�
��n-gram只支持0和1。
不知道,你这个版本可不可以支持2元分词。

2元分词的例子:
中华人民共和国 => 中华 华人 人民 民共 共和 和国

Original issue reported on code.google.com by ryanpoy@gmail.com on 21 Sep 2009 at 8:08

GoogleCodeExporter commented 9 years ago
sphinx-for-chinese还是基于sphinx的,目前还不支持2元切分。不过�
��合考虑,中文分词的效
果,比2元切分要好些

Original comment by blueflycn on 24 Sep 2009 at 9:01