lotem / rimeime

Legacy codebase of Rime, automatically exported from code.google.com/p/rimeime
49 stars 23 forks source link

建議吸收一些更大更權威的碼表 #309

Open GoogleCodeExporter opened 9 years ago

GoogleCodeExporter commented 9 years ago
目前碼表也基本夠用(除了地球拼音略小些),但 rimeime 
是精益求精的輸入法,可以更好。

這個壓縮包裏: http://www.unicode.org/Public/UNIDATA/Unihan.zip 有個 
Unihan_reading.txt 
。把粵唐日韓越去掉後,可得到四萬多字的漢語拼音,帶聲��
�。

中研院漢字構形資料庫: 
http://cdp.sinica.edu.tw/hanzi/cdphanzi.htm/cdphanzi.mdb 
,內有注音、部首、部件、倉頡、字頻等信息,但注音僅注��
�一萬多條。

香草輸入法: 
http://openvanilla.googlecode.com/svn/trunk/Modules/SharedData/
有不少碼表,有個 bpmf-ext.cin 
簡直神了,竟然有九萬多條注音信息。

Unihan 
的拼音是普通話,中研院和香草是臺灣國語,可考慮明月和��
�球拼音默認用 Unihan ,而注音默認用臺灣的。 Unihan Database 
是 unicode.org 
的項目,中研院更是權威機構,準確性極高。把碼表更換爲��
�據權威數據庫製作的碼表,更能體現 rimeime 的嚴謹。

Original issue reported on code.google.com by ForesterLian on 8 Nov 2012 at 11:02

GoogleCodeExporter commented 9 years ago
今收到《敎育部重編國語辭典》(http://dict.revised.moe.edu.tw/)�
��辭彙表(帶有聲調的拼音)

Original comment by chen....@gmail.com on 2 Mar 2013 at 11:37

GoogleCodeExporter commented 9 years ago
已匯入 moedict.tw 詞彙及註音。

Original comment by chen....@gmail.com on 8 Mar 2013 at 1:43