Closed GoogleCodeExporter closed 8 years ago
自己折腾了一天,大概把问题解决了。
此处是直接在 dict.utf8 上 patch,见附件中的 sunpinyin-dict.patch。
具体过程是先打上 sunpinyin-dict-fixtypo.patch
以修正少量的输入错误,然后将 dict.utf8 中所有的 lue、nue
替换成 lve、nve(注:这一系列 patch 是和 Issue 87
的补丁同时做的,见
http://code.google.com/p/sunpinyin/issues/detail?id=87),最后用
sunpinyin-dict-extend.py 将 Unihan 数据库(因此需要
Unihan.zip,可以从 unicode.org 下载)中的汉字导入到 dict.utf8
中。
以上步骤的细节详见附件中的 Makefile,这些操作对 dict.utf8
施加的改变的总和就是 sunpinyin-dict.patch。
Original comment by CasperVector
on 15 Aug 2011 at 6:03
之前的 python 脚本写得有点问题,现在是修正之后的版本……
Original comment by CasperVector
on 16 Aug 2011 at 7:35
Attachments:
针对新版本的 sunpinyin(e1fe9bce13,2012-2-21)和 Unihan
数据库(Unicode 6.1.0,2012-01-24)的脚本更新见附件。
Original comment by CasperVector
on 4 Mar 2012 at 1:53
Attachments:
[deleted comment]
非常感谢你的patch,能否移植到python 2.x的版本?
Original comment by find...@gmail.com
on 4 Mar 2012 at 2:07
我看看,似乎工作量应该不大……
Original comment by CasperVector
on 4 Mar 2012 at 2:20
终于改完了,全是在和 python2 的 unicode 支持在做各种斗争。
python 的 2/3 互换真是烦死了 = =b
Original comment by CasperVector
on 4 Mar 2012 at 4:33
Attachments:
Fixed in [https://github.com/sunpinyin/open-gram git] and
[http://code.google.com/p/open-gram/downloads/list downloads].
Original comment by CasperVector
on 26 Aug 2012 at 5:59
Original issue reported on code.google.com by
CasperVector
on 28 Jul 2011 at 1:58