mayabot / mynlp

一个生产级、高性能、模块化、可扩展的中文NLP工具包。(中文分词、平均感知机、fastText、拼音、新词发现、分词纠错、BM25、人名识别、命名实体、自定义词典)
https://mynlp.mayabot.com/
Apache License 2.0
675 stars 90 forks source link

解析人姓名问题 #16

Open wangyiran125 opened 4 years ago

wangyiran125 commented 4 years ago

你好,我使用这个接口获取人名,但是还有不准确的情况 PerceptronPersonNameService pps = Mynlps.instanceOf(PerceptronPersonNameService.class); List names= pps.findName(content); 下面是我解析出来的,这里面有比较多的不是人的姓名。我想问下这种情况需要怎么解决呢?谢谢~

[刘玄., 袁绍攻公孙瓒, 陈震传, 刘备乃, 陈登传, 宽厚弘毅, 遣钟繇, 司徒许靖, 袁绍相, 袁绍连和, 何有旦, 刘备诸葛亮, 刘禅刘永刘, 曹魏孙, 张楚政, 谥昭烈, 曹仁龟, 王聚之, 刘彭廖李刘魏杨, 子禅, 何有汉, 黄李吕马王张, 贤矣昭烈, 陈曶音笏, 杨募兵, 刘禅二子, 迁昭文, 王毌丘诸葛, 魏书七·吕布, 安平哀王, 袁公路近, 曹军奔, 董承辞, 董承受汉, 裴注, 刘辟寇, 曹公东, 张纯反, 史沛国刘岱, 刘备惠陵, 田楷东, 刘玄生, 刘永之子, 荣恩, 刘备弘毅, 张鲁遁, 刘备依庞, 刘备宽仁, 刘蒋, 屯小沛, 璋增, 刘备子, 刘永之孙, 费亭侯, 张松令法, 畏曹, 袁绍袁, 庞统进, 波谦, 刘备雄, 刘备曹操, 韩暹寇, 刘禅六子, 吴懿之妹, 绸缪恩, 竺之妹, 白璋, 张宗杨, 安平王, 刘玄德弘, 刘永异, 东海昌, 吴遣, 刘备有雄, 魏书一·武帝, 吴班击, 曹公南, 张辽进, 桑树生, 备谓瑜, 徐之, 刘备增, 刘备依, 刘备士兵, 刘备军, 刘禅三子, 陈寿赞, 袁绍抗, 伯豫君荆, 张郃相, 曹公征, 董卓趁, 刘公雄, 曹公兵, 德芳, 刘琮代立, 刘理之孙, 卢马妨, 肖国隆, 夏六月, 本璋, 魏吴, 庞统皆, 刘马陈董吕, 曹丕篡汉建, 黄家德, 马跃檀, 东海昌豨, 安平殇, 袁绍离, 曹公军, 崔高孙, 曹公果, 刘备曾孙, 曹公厚, 刘备孙子, 许汜君, 刘备因, 史田楷, 彭漾又璋, 沛时纳, 刘协刚, 黄湘阳, 白绍]

1 2

jimichan commented 4 years ago

感知机的确有这样的不确定性,你可以把原文给我测试,考虑加入一些规则进去

wangyiran125 commented 4 years ago

@jimichan 感谢回复,还请问下除了感知机还有其他方法吗?

jimichan commented 4 years ago

hanlp有个你可以试试,应该是基于HMM的,也加了很多规则了, 有时间您可以对比一下