DQinYuan / chinese_province_city_area_mapper

一个用于提取简体中文字符串中省,市和区并能够进行映射,检验和简单绘图的python模块
MIT License
1.65k stars 392 forks source link

地址不带“省、市、区”的也匹配不到 #32

Closed ppcfish closed 5 years ago

ppcfish commented 5 years ago

地址不带“省、市、区”的也匹配不到 杭州经济技术开发区10号大街

还有路名给匹配到省的: 嘉兴市乍浦镇雅山东路126、128、130、132号 | 山东省 | 嘉兴市 |  

DQinYuan commented 5 years ago

"杭州经济技术开发区10号大街"可能是分词的问题,尝试一下cut=False,能解决一些分词不准确的问题

DQinYuan commented 5 years ago

为啥我一下就匹配出来了。。。。

>>> cpca.transform(["杭州经济技术开发区10号大街"])
     省    市 区            地址
0  浙江省  杭州市    经济技术开发区10号大街
DQinYuan commented 5 years ago

路名会被误识别的问题还正在解决

ppcfish commented 5 years ago

为啥我一下就匹配出来了。。。。

>>> cpca.transform(["杭州经济技术开发区10号大街"])
     省    市 区            地址
0  浙江省  杭州市    经济技术开发区10号大街

噢,单独匹配确实没问题,可能我后续的处理给切掉了,应该是误报