Closed ppcfish closed 5 years ago
"杭州经济技术开发区10号大街"可能是分词的问题,尝试一下cut=False,能解决一些分词不准确的问题
为啥我一下就匹配出来了。。。。
>>> cpca.transform(["杭州经济技术开发区10号大街"])
省 市 区 地址
0 浙江省 杭州市 经济技术开发区10号大街
路名会被误识别的问题还正在解决
为啥我一下就匹配出来了。。。。
>>> cpca.transform(["杭州经济技术开发区10号大街"]) 省 市 区 地址 0 浙江省 杭州市 经济技术开发区10号大街
噢,单独匹配确实没问题,可能我后续的处理给切掉了,应该是误报
地址不带“省、市、区”的也匹配不到 杭州经济技术开发区10号大街
还有路名给匹配到省的: 嘉兴市乍浦镇雅山东路126、128、130、132号 | 山东省 | 嘉兴市 |