felixonmars / fcitx5-pinyin-zhwiki

Fcitx 5 Pinyin Dictionary from zh.wikipedia.org
The Unlicense
810 stars 42 forks source link

词典里有很多多音字的标注是错误的 #21

Open ililu2000 opened 3 years ago

ililu2000 commented 3 years ago

比如 孟山都 meng shan dou 应该是 孟山都 meng shan du

ipcjs commented 3 years ago

目前主仓库的代码没有考虑多音字的情况。

我fork的版本,针对多音字会把所有可能的组合都组词,结果是这样:

孟山都 meng shan dou
孟山都 meng shan du

无论你打du还是dou,都能打出来😏 如果你用的是繁体词库,可以试试我维护的版本,详细区别:https://github.com/ipcjs/fcitx5-pinyin-zhwiki/releases/latest

wtaochina commented 3 years ago

小鹤双拼下 孟山都 是 meng shan dou,没有meng shan du

wtaochina commented 3 years ago

主仓库的代码没有考虑多音字,多音字估计还是有点小问题,遇到这种情况可以用楼上ipcjs大大的fork版本

CoelacanthusHex commented 2 years ago

古文是标注错误的重灾区,比如 不与秦塞(se)通人烟 傅说(yue)举于版筑之间

ipcjs commented 2 years ago

@CoelacanthusHex 是被兩字詞污染了詞庫?

“維基大詞典”,主要還是解決詞庫量的問題,注音的準確率不能保證 還是像我維護的那個fork一樣,只保留三字或以上的詞組更好🤔️

CoelacanthusHex commented 2 years ago

@CoelacanthusHex 是被兩字詞污染了詞庫?

“維基大詞典”,主要還是解決詞庫量的問題,注音的準確率不能保證 還是像我維護的那個fork一樣,只保留三字或以上的詞組更好🤔️

应当不是有词干扰,就是注音的时候只标注了一个错误的音的问题