mozillazg / python-pinyin

汉字转拼音(pypinyin)
https://pypinyin.readthedocs.io
MIT License
4.9k stars 612 forks source link

多音字的拼音不准确 #173

Closed zjryan closed 4 years ago

zjryan commented 5 years ago

运行环境

问题描述

多音字拼音不准确 比如最并没有cuo这个音 撮也没有这么多音

问题复现步骤

In [2]: pypinyin.pinyin(u'撮', style=pypinyin.TONE2, heteronym=True) Out[2]: [[u'cuo1', u'zui4', u'zua1n', u'chua1', u'zuo3']]

In [3]: pypinyin.pinyin(u'最', style=pypinyin.TONE2, heteronym=True) Out[3]: [[u'zui4', u'cuo1']]

zjryan commented 5 years ago

多音字能否更换数据源?只使用常见的多音字就可以了

mozillazg commented 5 years ago

@zjryan 嗯,问题是没有找到更权威的电子版可编辑的数据源,现在用的已经是国际上比较权威的数据源了(基于 Unicode 组织的 Unihan Database 数据源),详见:https://github.com/mozillazg/pinyin-data

zjryan commented 5 years ago

@zjryan 嗯,问题是没有找到更权威的电子版可编辑的数据源,现在用的已经是国际上比较权威的数据源了(基于 Unicode 组织的 Unihan Database 数据源),详见:https://github.com/mozillazg/pinyin-data

这个项目我也看了,我现在的解决方案是自己reload了一下zdic.txt文件 希望以后能有个内置的数据源切换功能