rime / squirrel

【鼠鬚管】Rime for macOS
https://rime.im
GNU General Public License v3.0
4.63k stars 410 forks source link

使用简体时,“复”字和其它词汇组合多次输入都无法让输入法生成新候选词 #609

Open ruleroller opened 2 years ago

ruleroller commented 2 years ago

例如:复购、复买

输入fugou,fumai几十次都不能让输入法在候选词里记住,是不是存在bug?

ver:小狼毫 0.14.3、windows 10

而后,我尝试使用繁体字,打出“復購”、“復買”,只需要一次或两次,这两个词就会出现繁体的候选词中,而且我回到简体字输入,“复购”和“复买”也都出现在了候选词中,似乎可以推测“复购”和“復購”、“复买”和“復買”是互相绑定的,或许是“复”依赖于“復”导致的,不知是否算作一个bug?

lotem commented 2 years ago

是BUG。

關聯已知問題: rime/librime#251 rime/squirrel#437

ShikiSuen commented 2 years ago

依賴 OpenCC 轉換其實是個絕路。雖然 OpenCC 已經做到極致了,但只有簡繁體詞庫(包括用戶詞庫)彼此獨立才是正解。 唯一壞處就是兩份用戶詞庫都需要單獨馴養就是了。

P.S.: 前些天 zonble 為了證實他們小麥注音簡繁轉換可以趕上我下游專案這邊威注音的簡繁雙詞庫,一直在更新簡繁轉換模組。且也引入了類似於 RIME 的「前置轉換+候選字去重複」的設計。目前唯一的缺點就是「在自訂使用者語彙時,生成的自訂記錄會受到打繁出簡的模式的影響、而可能變成簡體中文記錄、影響繁體中文輸入模式的體驗」。在目前的我來看,任何形式的繁簡轉換,用在輸入法上,都是保守治療、都已經走到絕路。像 OpenCC 這樣的,對兩岸的最新化學元素用字支援就很難講。

ShikiSuen commented 2 years ago

@ruleroller 你的簡體模式有沒有開針對繁體字的反查?如果有的話,選字窗內是否有用括弧顯示個別簡化字對應的不同繁體字?

ShikiSuen commented 2 years ago

@lotem 請問您要不要考慮讓 RIME 在檢測到輸入法簡繁轉換模式有差異的時候分別生成不同的用戶語料庫? (然後系統在使用簡體模式時會自動從繁體語料庫將一些繁轉簡不會出錯的詞自動轉簡到簡體模式的用戶語料庫)

竊以為這是目前能想到的最好的保守治療方案。

P.S.: 這篇只是純討論而已。 P.P.S.: GitHub 現在允許 repo 開 discussion 版面,但需要倉庫主親自開放。開放的話,可以節省 issue 專區的內容的熵。