fourdimensions / ik-analyzer

Automatically exported from code.google.com/p/ik-analyzer
0 stars 0 forks source link

在使用智能分词和不使用智能分词对“1.8米”这种句子的拆分方法不同,查询准确性下降的问题 #82

Closed GoogleCodeExporter closed 9 years ago

GoogleCodeExporter commented 9 years ago
一般我们都是在index的时候用最大匹配模式
在query的时候使用自动匹配模式

“1.8米”这种句子
在最大匹配模式下会拆成‘1.8’ ‘米’两个term
在智能匹配模式下只会拆成‘1.8米’这一个trm

这样的情况下,查询就不能匹配到信息

如果在最大匹配模式下“1.8米”这种句子能拆成‘1.8’ 
‘米’‘1.8米’3个term
就会准确性高很多

此处谁有什么办法吗?

Original issue reported on code.google.com by wangwei....@gmail.com on 18 Oct 2012 at 7:41

GoogleCodeExporter commented 9 years ago
 查询的问题准确的说不是分词器问题!

用户应该选择适当的索引分词策略,并配合不同的查询时分��
�策略。这个问题展开了说是很大的。

Original comment by linliang...@gmail.com on 23 Oct 2012 at 9:22