mozillazg / python-pinyin

汉字转拼音(pypinyin)
https://pypinyin.readthedocs.io
MIT License
4.83k stars 608 forks source link

多音字数据库标准有些过于离谱 #293

Open FavorMylikes opened 1 year ago

FavorMylikes commented 1 year ago
pinyin("能", strict=False, heteronym=True)
[['néng', 'tái', 'nái', 'nài', 'xióng']]

代码, pinyi_dict.py

    0x80FD: 'néng,tái,nái,nài,xióng',

新华字典数据库

只包含 'néng', 'nài'

汉字数据库

néng(neng2) , tái(tai2) , nái(nai2) , nài(nai4) , xióng(xiong2)

Wiki

néng(neng2) , tái(tai2) , tài(tai4) , tāi(tai4), nái(nai2) , nài(nai4) , xióng(xiong2)

建议

mozillazg commented 1 year ago

@FavorMylikes 感谢建议!原因详见 https://github.com/mozillazg/python-pinyin/issues/263 这个 issue 中的讨论。

使用现行普通话标准的拼音数据库 或根据普通话 Mandarin粤语 Cantonese和其他方言在调用时提供参数

如果你有这几个数据库的文本化的数据的话,欢迎分享。