wyymichael / paoding

Automatically exported from code.google.com/p/paoding
0 stars 0 forks source link

添加一个自定义词典后分词不正确 #8

Closed GoogleCodeExporter closed 9 years ago

GoogleCodeExporter commented 9 years ago
短句:"中华人民共和国"

原来分词结果有"共和国",但是没有"国"字。

我增加了一个常用单个汉字的词典single.dic,比如说加了一个"
国"字,分词结果就
没有"共和国",这是为什么?

Original issue reported on code.google.com by wuguofen...@gmail.com on 21 Jan 2008 at 3:32

Attachments:

GoogleCodeExporter commented 9 years ago
共和国 已经可以由两个词组成 
“共和”和“国”,那就不会在分成合成词“共和国”
这是从全文检索原理出发有意处理的。

Original comment by qieqie.wang on 17 Mar 2008 at 3:16