Closed isnolan closed 10 years ago
words.dic文件中有“西红柿”一词,似乎是该字典未被加载所致,该如何解决?
1.确认字典使用utf8编码 2.使用complex模式 curl -XPOST http://localhost:9200/index/_analyze?analyzer=mmseg_complex -d'{ "text": "嘻嘻西红柿,真好吃,我也最好吃" }'
哦,使用了mmseg_complex就ok了,thx
mmseg_complex 和 mmseg_simple 在实现上的区别是啥 @medcl
@ng-wei complex分词逻辑更加复杂,会进行一些词义消歧的操作.
在elasticsearch-rtf/config/mmseg/words-my.dic中增加了自定义的一些词汇,比如“西红柿”,但是最终结果中分词出现的结果是这样:
对此,该如何处理,或是否有相关文档? thx