DQinYuan / chinese_province_city_area_mapper

一个用于提取简体中文字符串中省,市和区并能够进行映射,检验和简单绘图的python模块
MIT License
1.67k stars 396 forks source link

新疆自动补全问题 #9

Closed TerribleLife closed 6 years ago

TerribleLife commented 6 years ago

我拿这个地址试了一下:“新疆阿克苏地区阿克苏市实验林场二队”,只能把新疆识别出来,后面的阿克苏地区和阿克苏市虽然mappers里面都有写,但识别不出来,看了下可能是infrastructure.py里面fillProvince的问题,加了一行 if cls.province_country_mapper.get(word + "自治区"): return word + "自治区", True 然后在mappers.py里的province_country_mapper加了 '新疆自治区':'中国' 再跑就没问题了。 因为代码还没仔细研究过,不知道改的有没有问题,反正结果是对了。。 大佬有空可以看一下这个问题吗

DQinYuan commented 6 years ago

好像是有这个问题,谢谢了,我有空改一下。

DQinYuan commented 6 years ago

我大概测了一下,感觉和你的现象不太一样:

from cpca import *
transform(["新疆阿克苏地区阿克苏市实验林场二队"])

输出是:

      区     市   省      地址
0  阿克苏市        新疆  实验林场二队

除了市其他都提取出来了。 当然,这里还是有问题的,我正在改。

DQinYuan commented 6 years ago

修好了,你更新一下再试试 pip install -U cpca

我自测的结果:

from cpca import *
transform(["新疆阿克苏地区阿克苏市实验林场二队"])

输出:

      区      市         省      地址
0  阿克苏市  阿克苏地区  新疆维吾尔自治区  实验林场二队