fxsjy / jieba

结巴中文分词
MIT License
33.39k stars 6.73k forks source link

关键词提取时,自定义语料库中的词语不能被识别为关键词 #935

Open ZhiliangYao opened 3 years ago

ZhiliangYao commented 3 years ago

即使给自定义语料库中的词语设了很大的权值也无法提升词语在关键词中的次序

hyliu777 commented 3 years ago

重新生成tokenizer对象并加载字典 postokenizer = jieba.posseg.dt postokenizer.load_word_tag('自定义词典.txt')