hao0111 / ik-analyzer

Automatically exported from code.google.com/p/ik-analyzer
0 stars 0 forks source link

分词歧义集不完整 #128

Open GoogleCodeExporter opened 9 years ago

GoogleCodeExporter commented 9 years ago
我的词库中有以下词:

普通白炽灯泡
普通
白炽
灯泡
白炽灯

IK是可以拿到长度最大的歧义集“普通白炽灯泡”,并正确选
择这个最优结果。而我的程序是根据数据库中的词频来做歧��
�处理的,就必须遍历每一个歧义集。在IKArbitrator.judge方法中�
��能搜集到部分歧义集,特别是最重要的“普通”、“白炽”
、“灯泡”会丢失。
我调试了源代码,发现在judge方法中使用stack来记录产生歧义�
��词,并在forward方法中逐个添加歧义词并获得N个歧义集。但s
tack总是返回靠近末尾(先进栈的是靠前的)的歧义词,导致forwa
rd方法提前结束,丢失这个歧义集。我将stack改为queue就可以��
�

Original issue reported on code.google.com by znf...@gmail.com on 19 Oct 2013 at 8:21

GoogleCodeExporter commented 9 years ago
stack改为queue如何能解决这个问题呢?

Original comment by jichengl...@gmail.com on 9 Dec 2014 at 2:01