w2dp / ik-analyzer

Automatically exported from code.google.com/p/ik-analyzer
0 stars 0 forks source link

量词,10克解析不出来, 5克的词可以分出来。可能是对0的处理造成的。 #37

Closed GoogleCodeExporter closed 8 years ago

GoogleCodeExporter commented 8 years ago
What steps will reproduce the problem?
1. "1丈三百克1公克5克10克向迭代最细粒度切分算法2000ml, 
300克。550毫升时尚
2. 1丈, 三百克, 1公克, 5克, 10, 克, 向, 迭代, 最, 细粒度, 
切分, 算法,2000ml, 300, 克, 550, 毫升,
3.

What is the expected output? What do you see instead?

What version of the product are you using? On what operating system?

Please provide any additional information below.

Original issue reported on code.google.com by junli...@gmail.com on 14 Mar 2012 at 7:38

GoogleCodeExporter commented 8 years ago
本地测试没有出现您说的问题,结果如下:

$$  0-2 : 1丈 :    CN_QUAN
$$  2-5 : 三百克 :   CN_QUAN
$$  5-8 : 1公克 :     CN_QUAN
$$  8-10 : 5克 :   CN_QUAN
$$  10-13 : 10克 :     CN_QUAN
$$  13-14 : 向 :   CN_WORD
$$  14-16 : 迭代 :    CN_WORD
$$  16-17 : 最 :   CN_WORD
$$  17-20 : 细粒度 :     CN_WORD
$$  20-22 : 切分 :    CN_WORD
$$  22-24 : 算法 :    CN_WORD
$$  24-30 : 2000ml :    LETTER
$$  32-36 : 300克 :    CN_QUAN
$$  37-42 : 550毫升 :     CN_QUAN

另外发现数量词词典中缺“毫升”一词,已经补上,谢谢反��
�

Original comment by linliang...@gmail.com on 14 Mar 2012 at 9:27