avidyalalala / sunpinyin

Automatically exported from code.google.com/p/sunpinyin
0 stars 0 forks source link

如何添加新的拼音方案? #131

Open GoogleCodeExporter opened 9 years ago

GoogleCodeExporter commented 9 years ago
Sunpinyin 
的代码导读中提到它设计时就考虑到了支持不同的拼音方案��
�但如何才能
方便地添加一种拼音方案呢?

我这样理解 Sunpinyin 的工作流程:
    字符串 -> 音节(声韵调)-> 汉字 -> 词组(整句)
据此,我期望能这样添加一种拼音方案:
    制作汉字-音节对照表 -> Sunpinyin 读入该对照表 -> 使用
也就是让 Sunpinyin 
提供识别音节表的功能,跟传统输入法支持外挂码表差不多��
�

汉语方言种类繁多,语音差异大,但最终汉字表现出来的书��
�语比较统一,故各方言
其实可共用语言模型。只要 Sunpinyin 
做好添加拼音方案的功能,各方言使用者将大
大受益。

Original issue reported on code.google.com by 87wei...@gmail.com on 31 May 2010 at 11:19

GoogleCodeExporter commented 9 years ago
拼音字符串的切分是个比较复杂的流程,恐怕很难直接通过��
�表来直接生成。您可以参考现有的拼音切分器,或者提供对�
��的
关系,我们可以代为实现 ...

Original comment by find...@gmail.com on 31 May 2010 at 3:13

GoogleCodeExporter commented 9 years ago

Original comment by find...@gmail.com on 1 Jun 2010 at 3:28

GoogleCodeExporter commented 9 years ago
我只是个普通用户,暂时还无力读懂代码。至于“代为实现��
�,首先很感谢你们的热心,但如何敢
劳烦各位花时间在我的一己之需上呢?

下面这些本来应该放在讨论组上说的,只是现在无法访问。��
�还是就在这儿将我的想法再说详细
一点。

我很支持语言的多样化,也花了五六十个小时,对自己认识��
�约五千个汉字,整理了它们在我母
语(或者”母方言“)中的汉字语音。我试着用 ibus-table 
实现自己的“方言拼音输入”,结果发
现那种传统的查表型的输入体验的确已经无法接受了。后来��
�才找到了 Sunpinyin,一看到它支
持多拼音方案,我真的非常兴奋,想着自己的“母方言拼音��
�句输入”能够实现了。却没想到真要
添加拼音方案还是比较困难。

网上有不少人也在搞各自的“方言拼音输入法”,看来像我��
�样习惯用母语思维的人应该还是不少
的。所以我就会很希望有这样一个输入法平台,支持多拼音��
�案,同时能够进行整句输入。而且
添加拼音方案对一般用户要友好,不必进行源代码级的重构��
�那样不单是我,很多希望用母语输
入中文的人也将受益。

看来现在的 Sunpinyin 
是在架构上支持多拼音方案,但对一般用户不够友好。我希��
�
sunpinpyin 
能够降低添加拼音方案的难度。既然难以通过码表来生成,��
�否可以通过专门的工具
去给源码 patch 一下呢?

sunpinyin 
在开源界给大家提供了这么好的中文输入体验,贡献很大的��
�。如果你们觉得这个添
加拼音方案的特性不值得花太多时间去给部分用户实现,那��
�算了。或许我以后能读懂代码也有
足够时间的时候,再去自己弄吧。

Original comment by 87wei...@gmail.com on 1 Jun 2010 at 6:16

GoogleCodeExporter commented 9 years ago
@87weihua,如果不需要很多复杂的功能,例如自动纠错、模糊��
�、模糊切分,也不像双拼那样有很多重码的话(即拼音
字符串和音节是一一对应的),还是有机会实现一个拼音切��
�生成器的脚本来自动生成的。我也会找时间看看如何实现一
个。如果您能提供一个码表,我可以基于您的这个码表进行��
�些实验 ...

很感谢您的支持,我们会继续努力,让SunPinyin变的更好 ...

Original comment by find...@gmail.com on 1 Jun 2010 at 6:24

GoogleCodeExporter commented 9 years ago
不知应该给什么格式,那附上 sql 
文件吧,是我自己弄的音节-汉字对照表。说明:
1. 音节 = 声母 + 韵母 + 调号
                韵母 = 韵腹 + 韵尾
2. 零声母强制为 o
3. 每个音节对应的多个汉字未排序

用我的表做实验的话,受众太小,用粤语拼音可能人气旺些��
�在 ibus-table 的源码中有好几个粤语拼音方案的码
表,都是单字的,收字过万。不过这些码表里都没有声调。��
�又说回来,声调太多的话,输入时一个字的声调是不好感
受到的。所以其实还是不带声调的拼音输入比较好。

Original comment by 87wei...@gmail.com on 1 Jun 2010 at 10:06

Attachments:

GoogleCodeExporter commented 9 years ago
[deleted comment]
GoogleCodeExporter commented 9 years ago
嗯,好的,我先拿粤语拼音试一试,多谢了 :) 
且我们现在的词表中并没有声调的信息 ...

Original comment by find...@gmail.com on 1 Jun 2010 at 2:02