KusTa / paoding

Automatically exported from code.google.com/p/paoding
0 stars 0 forks source link

"湖北石首"分词问题请教 #43

Open GoogleCodeExporter opened 9 years ago

GoogleCodeExporter commented 9 years ago
您好,我在使用庖丁进行中文分词中,遇到一个问题。

以下四个短语,分词的效果不是很理想。请问有什么好办法��
�?
“湖北省石首市”
“湖北石首”    
“蒋介石首次发表了”
“钻石首饰”

非常感谢您的帮助。
我同时在您的Project Home中留言了。谢谢。

Original issue reported on code.google.com by wen...@gmail.com on 15 Sep 2009 at 2:39

GoogleCodeExporter commented 9 years ago
以目前的分词算法,这个问题的确比较困难。
我会在一定时间之后出3版本。我想改变一下算法。

Original comment by qieqie.wang on 15 Sep 2009 at 6:42

GoogleCodeExporter commented 9 years ago
这个库可以cover @wengsf的case:
http://smallseg.appspot.com/smallseg

Original comment by ccnu...@gmail.com on 7 Dec 2009 at 8:48