lancopku / pkuseg-python

pkuseg多领域中文分词工具; The pkuseg toolkit for multi-domain Chinese word segmentation
MIT License
6.55k stars 986 forks source link

在user_dict匹配处有个bug #137

Open kekeadou opened 3 years ago

kekeadou commented 3 years ago

第90行,Preprocesser类,solve函数,应该found=True同时,也加上j = last_word_idx + 1。

反例如下: user_dict.txt: 车 车在中国

执行pkuseg.cut('电动车在上海')时,会cut出 电动/车在/上海