iDvel / rime-ice

Rime 配置:雾凇拼音 | 长期维护的简体词库
https://dvel.me/posts/rime-ice/
GNU General Public License v3.0
9.44k stars 631 forks source link

请问两分输入法如何输出为繁体中文? #616

Closed BentleyKI closed 9 months ago

BentleyKI commented 9 months ago

目前我是透过修改double_pinyin_fllypy.custom.yaml的方式, 直接把 traditionalized 的 excluded type 设为空值, 就可以顺利的输出繁体中文。

然而,我注意到原始设置特意排除了reverse lookup, 因此想询问我这种修改方式是否是正确的,或者是否有更好的方法。 我担心原始设置中特意排除reverse lookup可能是出于性能方面的考虑,所以我希望确认一下。

double_pinyin_fllypy.custom.yaml

  engine/filters:
    - lua_filter@corrector               
    - simplifier@emoji                  
    - simplifier@traditionalize           # 简繁切换
    - simplifier@zh_tw                    # 台湾繁体
    - lua_filter@autocap_filter           
    - lua_filter@reduce_english_filter   
    - uniquifier

  # 简繁切换
  traditionalize/opencc_config: s2tw.json
  traditionalize/excluded_types: [] # 转换成繁体中文

  # 轉換爲正體中文
  zh_tw:
    option_name: zh_tw
    opencc_config: t2tw.json
    tips: none                
    excluded_types: []  # 转换成繁体中文
BentleyKI commented 9 months ago

感谢原本楼上的回答(不知道为何回答不见了?)

后来发现拆字有分繁体跟简体写法后才发现不能直接拿这8105字的字库来用,因为里面大多是简体字的拆法。 所以后来请了GPT帮忙根据8105字库产生了对应的繁体字的dict.yaml,这样就能使用繁体字的拆法了。 liangfen_minified.dict.yaml.txt (yaml没办法直接传所以加了txt后缀)

不过也发现了另外两个问题,想再请教一下

  1. 生成的dict.yaml文件中都是繁体字,因为我现在使用的是雾凇字库。我想知道是否需要将这个yaml转换成简体字,以避免输入记录同时储存了简体和繁体字?好像在哪里有看到这样对于养词库不太好?
  2. 在实际转换字库的过程中,我发现有些原本应该是繁体字的字被错误地再次转换成了繁体字,例如亘=>亙干=>乾。请问是否有更好的解决方法?

再次感谢~

iDvel commented 9 months ago

你到底是要干嘛?两分是个和简繁无关的输入方案,一个字的简繁分别有不同的编码,为什么要简繁转换?和 8105 字表又有什么关系?

BentleyKI commented 9 months ago

抱歉,我之前表达得不够清楚。 我的目标是在使用双拼输入法时, 只显示繁体字作为候选字,同时排除生僻字。

请问如何修改以实现这个目标?谢谢!

iDvel commented 9 months ago

你要在双拼方案的繁体状态下,使用两分拼字,希望拼字的结果全部都是繁体字和非生僻字? 可以直接删除 liangfen.dict.yaml 里的纯简体字与生僻字,你得找一份你觉得合适的繁体字表作为参照,删除不在这个字表的字。

BentleyKI commented 9 months ago

了解谢谢~ 我应该会先以上面根据8105字表转换后的yaml为基底再做修改