yanyiwu / cppjieba

"结巴"中文分词的C++版本
MIT License
2.57k stars 690 forks source link

[Feature Request] 能否给 Jieba 添加一个传入文件内容接口? #158

Closed cathaysia closed 3 years ago

cathaysia commented 3 years ago

目前如果要使用 cppjieba 的话,词典文件需要导入 5 个,而且是分散开的。但是如果使用 cmcr 将文件编译进二进制文件中的话,就可以大幅度减少文件的大小,而且还是一个单一的二进制文件。但是 cmcr 只能传出一个 iterator 的指针,如果 cppjieba 支持传入文本字符串的话,就可以先将文件读取指针中,再将内容传给 cppjieba