DQinYuan / chinese_province_city_area_mapper

一个用于提取简体中文字符串中省,市和区并能够进行映射,检验和简单绘图的python模块
MIT License
1.65k stars 390 forks source link

简称“吉林”,导致的匹配错误 #89

Open gingercner opened 3 years ago

gingercner commented 3 years ago

吉林某某市某某区

list_location = [ "吉林通化市东昌区江南大街与江畅路交汇处", "吉林延吉市公园街延河路与新民街交汇处", "吉林长春市净月开发区生态大街" ] df = cpca.transform(list_location, umap={}, pos_sensitive=True) df

地址 adcode 省_pos 市_pos 区_pos
吉林省 吉林市 None 通化市东昌区江南大街与江畅路交汇处 220200 -1 0 -1
吉林省 吉林市 None 延吉市公园街延河路与新民街交汇处 220200 -1 0 -1
吉林省 吉林市 None 长春市净月开发区生态大街 220200 -1 0 -1
DQinYuan commented 3 years ago

用的是哪个版本呢?应该可以通过升级版本解决.

0.5.5 版本测试正常

>>> import cpca
>>> cpca.transform(["吉林通化市东昌区江南大街与江畅路交汇处"])
     省    市    区           地址  adcode
0  吉林省  通化市  东昌区  江南大街与江畅路交汇处  220502
gingercner commented 3 years ago

用的是哪个版本呢?应该可以通过升级版本解决.

0.5.5 版本测试正常 看了下,0.5.5 版本的结果与“adcodes.csv”文件中,“吉林市“和”吉林省“记录的出现顺序有关。 transform的结果是后面的那个记录。