DQinYuan / chinese_province_city_area_mapper

一个用于提取简体中文字符串中省,市和区并能够进行映射,检验和简单绘图的python模块
MIT License
1.65k stars 392 forks source link

结巴分词精细度默认值设置为可调怎样? #74

Closed CaptXiong closed 3 years ago

CaptXiong commented 3 years ago

这样一个地址“武汉东湖新技术开发区”,由于武汉后面没有市,jie.cut默认是cut_all为False,所有会提取不到,建议加个设置,并且设置默认为True,还没测试速度会慢多少,俺自己改了个先用着,作者觉得可以的话我就测测提个代码。

waketzheng commented 3 years ago

可行,建议提PR

CaptXiong commented 3 years ago

才发现新版已经没有jieba了,0.5.1已经可以识别我说的这个例子了

DQinYuan commented 3 years ago

做了一些更新,现在已经不进行分词了