cloudtrends / paoding

Automatically exported from code.google.com/p/paoding
0 stars 0 forks source link

用poading 对“万科金御华府”进行分词(问题一) #35

Open GoogleCodeExporter opened 9 years ago

GoogleCodeExporter commented 9 years ago
环境
   词库中有 “万科金御华府”,“万科”“华府”
   分词结果
           万科
           华府
           万科金御华府
 在分词结果中 金御/金/御  
 想问一下qieqie,这是什么原因造成的,我看了一下代码,好像“万科金御华府”没有经过二 
元分词,而"金御"在词库中没有,所以就没有分出金御/金/御

 /表或之意

Original issue reported on code.google.com by seal_bir...@sohu.com on 8 Jun 2009 at 9:56

GoogleCodeExporter commented 9 years ago
对不起,这个issue内容我不能完全明白,您重新描述一下

Original comment by qieqie.wang on 8 Jun 2009 at 10:16

GoogleCodeExporter commented 9 years ago
环境
   词库中有 “万科金御华府”,“万科”“华府”
   分词结果
           万科
           华府
           万科金御华府

就是金御未能成词,我希望的结果包括 
万科/华府/金御/万科金御华府,不知这样描述是否可以明白

Original comment by seal_bir...@sohu.com on 9 Jun 2009 at 3:20

GoogleCodeExporter commented 9 years ago
把“金御”纳入词库才能成。

Original comment by qieqie.wang on 9 Jun 2009 at 3:22

GoogleCodeExporter commented 9 years ago
但可能有好多这些未在词库中出现的词(未登陆词),而又��
�能够分词出来,这种想法可行吗

Original comment by seal_bir...@sohu.com on 9 Jun 2009 at 3:41

GoogleCodeExporter commented 9 years ago
像万科金御华我把府字删除掉,就能分金御出来了

Original comment by seal_bir...@sohu.com on 9 Jun 2009 at 3:42

GoogleCodeExporter commented 9 years ago
像“万科金御华府”我把“府”字删除掉,就能分“金御”��
�来了,而多一个“府”就分不出来,要是类似这
种情况能分出来多好啊,这样就不会出现有些文档找不出来��
�

Original comment by seal_bir...@sohu.com on 9 Jun 2009 at 3:46

GoogleCodeExporter commented 9 years ago
还请 qieqie 
能不能多考滤一下啊,谢谢你为大家开发了一个这样的好分��
�系统,还有一个问题分词中能不能
加入消歧的一些功能

Original comment by seal_bir...@sohu.com on 9 Jun 2009 at 3:48