haluo / fudannlp

Automatically exported from code.google.com/p/fudannlp
0 stars 0 forks source link

当句子有字母时分词错误 #45

Open GoogleCodeExporter opened 8 years ago

GoogleCodeExporter commented 8 years ago
FudanNLP1.05, 
或者使用在线demo (http://jkx.fudan.edu.cn/nlp/fudannlp.do) 
对如下句子分词:

 VB对动态网页支持不够好

期待结果:至少单词VB后面应该分界:VB 对 动态 网页 支持 
不够 好
程序结果:VB对 动态 网页 支持 不 够 好

如果是训练语料存在这种误差,那么应该进行预处理/后处理�
��采用rules来切分不同字符集之间的混合句子。

Original issue reported on code.google.com by w...@swiftkey.com on 5 Jun 2013 at 1:28