fxsjy / jieba

结巴中文分词
MIT License
32.86k stars 6.71k forks source link

運行中修改字典,重新load cache #327

Open mmmaaaxxx77 opened 8 years ago

mmmaaaxxx77 commented 8 years ago

在cut句子以後,如果變更字典集,不會更新到cache,有什麼方法可以在initialize還可以重新建立一次cache嗎?

ex. jieba.cut("我的靴子裡有蛇") #我/ 的/ 靴子/ 裡有/ 蛇 jieba.add_word("我的靴子") jieba.cut("我的靴子裡有蛇") #還是... 我/ 的/ 靴子/ 裡有/ 蛇

ljluestc commented 4 months ago

import jieba

# 初始分词
text = "我的靴子裡有蛇"
print("/ ".join(jieba.cut(text)))  # 输出初始的分词结果

# 添加新词
jieba.add_word("我的靴子")
# 或者使用 load_userdict('path/to/userdict.txt') 加载自定义词典

# 重新初始化 jieba
jieba.initialize()

# 再次分词
print("/ ".join(jieba.cut(text)))  # 输出更新词典后的分词结果