Open hotoo opened 10 years ago
分词模块自动联想合并词组本来是挺好的,但是作为拼音的依赖模块,这个功能反而带来了麻烦。 这种不确定性导致词组拼音库极大的增加,如果可以不做联想,返回最小词组(成语例外)就比较好处理了。比如:
注:最小词组也许不准确,比如成语可以继续拆分,应该优先返回成语。
不同的使用场景可以要求不同,比如对于拼音来说,拆分成『最小』、准确的词组会比较好;而对于语义分析坑能联想会较好。
期待你的意见 :smiley:
https://github.com/hotoo/node-pinyin/issues/18
分词模块自动联想合并词组本来是挺好的,但是作为拼音的依赖模块,这个功能反而带来了麻烦。 这种不确定性导致词组拼音库极大的增加,如果可以不做联想,返回最小词组(成语例外)就比较好处理了。比如:
注:最小词组也许不准确,比如成语可以继续拆分,应该优先返回成语。
不同的使用场景可以要求不同,比如对于拼音来说,拆分成『最小』、准确的词组会比较好;而对于语义分析坑能联想会较好。
期待你的意见 :smiley: