DQinYuan / chinese_province_city_area_mapper

一个用于提取简体中文字符串中省,市和区并能够进行映射,检验和简单绘图的python模块
MIT License
1.67k stars 396 forks source link

请问如何添加地址 #16

Open x2584179909 opened 5 years ago

x2584179909 commented 5 years ago

我发现对香港和澳门及台湾的匹配有些问题,同时我有对国外数据进行匹配的需求,我组建了自己的地址表,如何添加到此模块?

DQinYuan commented 5 years ago

能把匹配的有问题的地址贴出来一些吗?

你自己组建的地址表是什么格式呢?目前没有自己添加地址的功能,你们一般地址表用的什么格式,我下一版增加这个功能。

x2584179909 commented 5 years ago

香港匹配出来的是香港,而不是香港特别行政区 地址我这用的是dict格式 { "Province" : "加利福尼亚州", "City" : "旧金山", "district" : "-1", "newName" : "-1", "Country" : "美国", "SightZone" : "-1", "data" : "北美洲美国加利福尼亚州旧金山-1-1", "Continent" : "北美洲" } 请对匹配提出建议

DQinYuan commented 5 years ago

目前香港澳门的问题以及解决了:

import cpca
cpca.transform(["香港", "澳门"])

输出:

         省                   市                        区 地址
0  香港特别行政区  香港特别行政区
1  澳门特别行政区  澳门特别行政区
DQinYuan commented 5 years ago

至于自己添加数据的功能,还在开发中,目前的话可以考虑把代码clone下来,把数据按照格式补充进cpca/resources/pca.csv即可