DQinYuan / chinese_province_city_area_mapper

一个用于提取简体中文字符串中省,市和区并能够进行映射,检验和简单绘图的python模块
MIT License
1.67k stars 396 forks source link

广州南沙在地址库且唯一但是提示无法映射? #52

Closed johny123123 closed 3 years ago

johny123123 commented 4 years ago

from cpca import area_map area_map.get_relational_addrs('南沙区') [('广东省', '广州市', '南沙区')] location_str = ["南沙区","南沙"] df = cpca.transform(location_str) WARNING:root: 无法映射, 建议添加进umap中 WARNING:root: 无法映射, 建议添加进umap中

DQinYuan commented 4 years ago

应该是分词的问题,把分词关掉就好了。

cpca.transform(["南沙区"], cut=False)
     省        市           区            地址
1  广东省  广州市  南沙区  
johny123123 commented 4 years ago

谢谢你的回复。 经过测试,关掉分词,确定可以正确映射。 等有时间再研究一下原因了,啊哈哈