DQinYuan / chinese_province_city_area_mapper

一个用于提取简体中文字符串中省,市和区并能够进行映射,检验和简单绘图的python模块
MIT License
1.65k stars 392 forks source link

省略区字无法映射,上海市浦东新区无法识别 #36

Open tomhollandhku opened 5 years ago

tomhollandhku commented 5 years ago

‘上海市浦东新区芳甸路’和‘罗湖宝岗路‘无法识别

DQinYuan commented 5 years ago

"上海市浦东新区"分词的时候会分错,建议开全文模式

>>> cpca.transform(['上海市浦东新区芳甸路'], cut=False)
     省    市     区        地址
0  上海市  上海市  浦东新区  芳甸路
DQinYuan commented 5 years ago

罗湖宝岗路是哪里的地址?

tomhollandhku commented 5 years ago

深圳罗湖区

DQinYuan commented 5 years ago

区字不能省略,如果可以区字都可以省略的话就太容易匹配错误了,毕竟全中国区那么多