fxsjy / jieba

结巴中文分词
MIT License
33.39k stars 6.73k forks source link

jieba.set_dictionary 给定的词性没有效果,统一变成了x #998

Closed coder-2014 closed 1 year ago

coder-2014 commented 1 year ago

user_dict.txt 内容:

理想西溪金座 100 a 理想伊萨卡 100 a

另外还想问下,set_dictionary 的功能是替换默认字典,为什么我的字典只有2个词,会切出“哪个”,“位置”,“在”这些词呢?

微信截图_20230811160509

coder-2014 commented 1 year ago

已解决,使用如下方式

jieba.posseg.initialize("user_dict.txt")  # 手动初始化(可选)

sentence = '理想西溪金座在哪个位置。'

for pair in jieba.posseg.cut(sentence):
    print(pair)
ringge commented 10 months ago

已解决,使用如下方式

jieba.posseg.initialize("user_dict.txt")  # 手动初始化(可选)

sentence = '理想西溪金座在哪个位置。'

for pair in jieba.posseg.cut(sentence):
    print(pair)

如果兩種user_dict和default_dict(jieba原來提供得)都使用可以嗎?我沒找到方法,因為jieba.posseg.initialize()只能加載一個辭典