tinyfool / ChineseWithEnglish

绝对有趣的中文发音引擎 funny chinese text to speech enginee
50 stars 12 forks source link

王小波说过,“对于一些书来说,有趣是它存在的理由;对于另一些书来说,有趣是它应达到的标准。”这个项目的目的就是有趣,它很难成长为一个有用的项目,那么让我们坚持有趣吧。

项目的来源是,有一天我发现Mac OS X是支持语音输出的,很happy的决定用它来学英语,后来我甚至用语音api加上Xcode里面的PDF阅读器例子结合在一起,写了一个专门帮你在看PDF文件的时候查字典和发声的PDF阅读器Tiny4Reader( http://tiny4.org/prog/diary/2009/12/tiny4readermac.html )。但是这个语音输出只支持英文不支持中文,我想用它写个自动读小说的工具,就没有办法了。这时候我突发奇想干脆用英语来试图拼凑中文,后来我用Mac命令行命令say做了实验,发现这个思路还是可行的。

例如,你可以在Mac命令行键入如下的命令: say ni hao

说:你好

say wo i ni

说:我爱你

等等。

实际上这个项目就是,如果我们能找到一个对应表,中文文字->中文拼音,中文拼音->英文发音,我们可以很轻松的打造一个中文发音引擎。当然,这就是这个项目有趣的地方了,这个效果肯定不会好到哪里去,估计不管我们怎么优化,最后的结果也是像大山老师讲中文,不过已经很有趣是吧?

中文文字->中文拼音相对简单,01年的时候,我的一个师兄做过一个软件叫做白浪语音板,做法就是找了windows全拼输入法的码表作为中文文字->中文拼音的对照表。然后自己录了400多个声音文件(没有声调的话,中文只有400多个发音)。

所以这个项目一开始的目标就是征集中文文字->中文拼音的码表,以及最重要的征集中文拼音->英文发音的对应表,欢迎大家一起努力凑齐所有400多个中文语音,然后这个发音引擎就做好了,哈哈。

中文拼音->英文发音的码表文件叫c2e.txt,目前我只放进去了wo ai ni这三个拼音对应的英文,希望随着大家的一起努力我们可以凑齐所有的码表。

欢迎大家帮我找各种中文拼音->英文发音的匹配,找到的话,请发到 https://github.com/tinyfool/ChineseWithEnglish/issues 里,谢谢。