Closed ShikiOkasaka closed 1 day ago
v0.15.6の辞書内の漢語の統計
辞書 | 同音語数 | 語数 |
---|---|---|
restrained.1.dic | 31 | 760 |
restrained.2.dic | 590 | 3817 |
restrained.3.dic | 1903 | 8507 |
restrained.4.dic | 3715 | 13812 |
restrained.5.dic | 6181 | 19876 |
restrained.6.dic | 8297 | 24432 |
restrained.7.dic | 15587 | 39632 |
restrained.8.dic | 18425 | 44875 |
restrained.9.dic | 18485 | 45081 |
2024/7/2時点の漢語の統計
辞書 | 同音語数 | 語数 |
---|---|---|
restrained.1.dic | 13 | 633 |
restrained.2.dic | 271 | 2893 |
restrained.3.dic | 862 | 5811 |
restrained.4.dic | 1595 | 8950 |
restrained.5.dic | 2692 | 11892 |
restrained.6.dic | 3435 | 13990 |
restrained.7.dic | 9574 | 28785 |
restrained.8.dic | 11082 | 30866 |
restrained.9.dic | 11460 | 33668 |
28698f465423b31b942a0368af08de3dfa57049c
a39854b0d67544788c309450db72e95519044316 で第一段階は終了としておきます。
保科孝一,『国語問題五十年』, p250, 昭和24年.
いまのひらがなIMEの漢字辞書はSKKのML辞書をベースにつくられています。この辞書のなかにも、まだ同音語がたくさんあります。つかうことのない漢語を辞書から削除していければ、漢字変換のコストもさげていくことができます。
手順
restrained.8.dicは3万行以上あり、いっきに同音語を整理していくのはたいへんです。削除候補となる漢語があれば、ぜひプルリクエストをおくってください。
プルリクエストの例: https://github.com/esrille/ibus-hiragana/pull/150
整理のしかたのかんがえかた
つぎのような語は標準の漢字辞書・カタカナ辞書から削除しても問題ないとかんがえられます。
こうした語は、個人用の辞書に登録して対応するようにすれば、日常的な作文のなかでの漢字変換のコストをさげられます。