yuntians / paoding

Automatically exported from code.google.com/p/paoding
0 stars 0 forks source link

为什么词典加载不起作用 #81

Open GoogleCodeExporter opened 8 years ago

GoogleCodeExporter commented 8 years ago
我在用paoding的svn最新版本时,对'中华人民共和国属于第三世
界'进行分词,结果如下:

paoding> 中华人民共和国属于第三世界;
1:  中华/华人/人民/共和/共和国/属于/第三/三世/世界/

    分词器net.paoding.analysis.analyzer.PaodingAnalyzer
    内容长度 13字符, 分 9个词
    分词耗时 1ms 

为什么nation.dic中有"中华人民共和国"这个词,paoding没有分为1
个却进行了多元分词成了5个,有解决办法吗?

Original issue reported on code.google.com by kingour1...@gmail.com on 10 Jan 2011 at 4:28

GoogleCodeExporter commented 8 years ago
我顺便回答这个问题吧~~
在字典目录下,有一个隐藏目录(Linux系统以.开头),隐藏目�
��名为:.compiled,你自己看看,改动下就可以了。
或者干脆删除掉。
paoding在加在字典时,如果没有这个目录,就重新生成。

Original comment by fantaxy0...@gmail.com on 25 Jan 2011 at 2:56

GoogleCodeExporter commented 8 years ago
回楼上的 我把.compiled去掉还是不行 感觉很奇怪

Original comment by tree135...@gmail.com on 20 Feb 2011 at 10:32

GoogleCodeExporter commented 8 years ago
回comment2 
我也遇到了这个问题,发现把.compiled删除掉还是不行。所以��
�不删除它。就直接在vocabulary.dic.compiled文件中添加"自己希望�
��词",就OK。

Original comment by ringre...@gmail.com on 2 Jul 2011 at 8:42