Closed sonnycalcr closed 2 months ago
@sonnycalcr 这个是因为那几个字符其实并不是你预期的那几个汉字:
>>> ord( '⼀')
12032
>>> ord( '一') # 预期应该是这个
19968
>>> ord('⻄')
11972
>>> ord('西') # <-
35199
>>> ord('⽅')
12101
>>> ord('方') # <-
26041
之前也有类似的反馈 https://github.com/mozillazg/python-pinyin/issues/314 , 等我后面有空的时候调研一下有哪些存在这种情况的异体字,以及看看是否需要支持这些异体字的拼音(这些字本身没有拼音,考虑按字形注音)。
@sonnycalcr 这个是因为那几个字符其实并不是你预期的那几个汉字:
>>> ord( '⼀') 12032 >>> ord( '一') # 预期应该是这个 19968 >>> ord('⻄') 11972 >>> ord('西') # <- 35199 >>> ord('⽅') 12101 >>> ord('方') # <- 26041
之前也有类似的反馈 #314 , 等我后面有空的时候调研一下有哪些存在这种情况的异体字,以及看看是否需要支持这些异体字的拼音(这些字本身没有拼音,考虑按字形注音)。
感谢解惑~
运行环境
问题描述
具体看下面的代码片段及输出,
输出为:
可以看到,这里出现了部分的字和词没有标注拼音的情况。
问题复现步骤
运行上面的代码片段即可。