Open MorvanZhou opened 5 years ago
@MorvanZhou 我也碰到这个问题,没想到碰到莫凡大佬了,看过大佬视频
看来只能先硬改
x.handle.Tokenize(string(sentence), gojieba.SearchMode, true)
了
@naiba 哈哈,都是缘分
请问各位大佬,在结合bleve实现中英文搜索时如何设置 gojieba 的 hmm=true
呢?
@leafney go mod vendor
或者使用 dep
硬改 vendor
里面 gojieba
的代码。
x.handle.Tokenize(string(sentence), gojieba.SearchMode, true)
@naiba 我还在考虑是否有什么选项呢,这操作果然够直接。感谢!
看来只能先硬改
x.handle.Tokenize(string(sentence), gojieba.SearchMode, true)
了
但是我发现开启这个选项之后,搜索英文虽然正常,但是搜索速度变得很慢啊
慢是其他问题。目前看起来正常
在某些设置状态下,英文单词期望被拆成词语,但是实际上会被拆分成字母,举例说明:
总结下来,应该是只有在hmm=true的时候,才能实现词语级别的拆分,而
Cut(s, hmm=false)
,CutAll(s)
,CutForSearch(s, hmm=false)
都会被拆成字母。望解决。