Closed bung87 closed 6 years ago
遗留问题: jieba用正则筛选哪些应该被cut的部分 cppjieba用字符范围过滤不应被cut的部分 导致符号数字和中英混合的时候结果和jieba不同
详见: https://github.com/bung87/cppjieba-py/blob/master/performace_test/consistency.py 注释的部分无论是否使用hmm都不会通过。
CI 检查失败了,修改后我的测试通过了更多,不知为何cpp测试反而失败了,我加载的最新jieba的词典,先这样吧。
遗留问题: jieba用正则筛选哪些应该被cut的部分 cppjieba用字符范围过滤不应被cut的部分 导致符号数字和中英混合的时候结果和jieba不同
详见: https://github.com/bung87/cppjieba-py/blob/master/performace_test/consistency.py 注释的部分无论是否使用hmm都不会通过。
CI 检查失败了,修改后我的测试通过了更多,不知为何cpp测试反而失败了,我加载的最新jieba的词典,先这样吧。