BYVoid / OpenCC

Conversion between Traditional and Simplified Chinese
https://opencc.byvoid.com/
Apache License 2.0
8.3k stars 974 forks source link

tw2sp.json中将"字母" -> "本母" #848

Open uuuidada opened 5 months ago

uuuidada commented 5 months ago

tw2sp.json中将"字母" -> "本母" 想请教下为什么做这种转换,我没有找到相关的资料,谢谢!

danny0838 commented 3 months ago

實際去試輸入「字母」,輸出也還是「字母」,並沒有什麼問題,所以這位同學的問題是錯的。以後問問題請精確點,否則大家無法重現問題可能不會重視。

不過我還是幫你調查了,這是因為中國/台灣的IT常用詞是「文本」/「文字」,因此在轉換時,「英文字母」就會因為切詞錯誤被誤轉成「英文本母」。

如果要用詞庫解決這類問題,大概得加上「英文字=>英文字」、「英文字母=>英文字母」、「法文字=>法文字」、「法文字母=>法文字母」、……把全世界各種語言都加進去,看各位大姥有沒有想做XD

我用自己的系統稍微測試了下,可以在簡繁祕書線上版測試各種轉換方案的效果。patch 的設定檔和詞典可以去翻 gh-pages 分支的歷史找到。