tenlee2012 / elasticsearch-analysis-hao

一个非常hao用的elasticsearch(es)中文分词器插件
Apache License 2.0
231 stars 28 forks source link

希望增加 hao_max_word 模式 #55

Open qbit-git opened 1 year ago

qbit-git commented 1 year ago

hao 分词器

ik 分词器

建议

希望增加类似 ik_max_mode 模式的 hao_max_word 模式

tenlee2012 commented 1 year ago

当前在 and 模式下,搜索“图书股”不能匹配“ 图书发行第一股”

需要开启 enableSingleWord=true,继续递归,直到单字位置

qbit-git commented 1 year ago

enableSingleWord=true 会分词出:图书股、图书、图、书、股 全部成单字也不好 既然“图书”从“图书股”里面分了出来,那么剩余的部分不要直接丢弃 剩余部分不能再分成词可以分成单字,但也不要把所有单字分出来 比如“图书头大”, 不要分词成 图书、图、书、头、大 可以分词成 图书、头、大