BYVoid / OpenCC

Conversion between Traditional and Simplified Chinese
https://opencc.byvoid.com/
Apache License 2.0
8.3k stars 974 forks source link

chore: update TW phrases #841

Closed RUI-LONG closed 4 months ago

RUI-LONG commented 7 months ago

Add the following words to dictionary

https://dict.revised.moe.edu.tw/search.jsp?md=1&word=高階語言 https://dict.revised.moe.edu.tw/search.jsp?md=1&word=動畫 https://dict.revised.moe.edu.tw/search.jsp?md=1&word=屬性 https://dict.revised.moe.edu.tw/search.jsp?md=1&word=通道 https://dict.revised.moe.edu.tw/search.jsp?md=1&word=指令 https://dict.revised.moe.edu.tw/search.jsp?md=1&word=註解 https://dict.revised.moe.edu.tw/search.jsp?md=1&word=電腦 https://dict.revised.moe.edu.tw/search.jsp?md=1&word=常數 https://dict.revised.moe.edu.tw/search.jsp?md=1&word=建立 https://dict.revised.moe.edu.tw/search.jsp?md=1&word=範例 https://dict.revised.moe.edu.tw/search.jsp?md=1&word=備用 https://dict.revised.moe.edu.tw/search.jsp?md=1&word=首頁 https://dict.revised.moe.edu.tw/search.jsp?md=1&word=搖桿 https://dict.revised.moe.edu.tw/search.jsp?md=1&word=清單 https://dict.revised.moe.edu.tw/search.jsp?md=1&word=對應 https://dict.revised.moe.edu.tw/search.jsp?md=1&word=導向 https://dict.revised.moe.edu.tw/search.jsp?md=1&word=物件 https://dict.revised.moe.edu.tw/search.jsp?md=1&word=封包 https://dict.revised.moe.edu.tw/search.jsp?md=1&word=參數 https://dict.revised.moe.edu.tw/search.jsp?md=1&word=文章 https://dict.revised.moe.edu.tw/search.jsp?md=1&word=協定 https://dict.revised.moe.edu.tw/search.jsp?md=1&word=回應 https://dict.revised.moe.edu.tw/search.jsp?md=1&word=設定 https://dict.revised.moe.edu.tw/search.jsp?md=1&word=透過 https://dict.revised.moe.edu.tw/search.jsp?md=1&word=帳戶

danny0838 commented 4 months ago

我認為表中很多項目需要商榷。

目前似乎還沒有一個明確的地區詞方針,就我個人而言,我認為原則上要滿足以下幾個條件:

  1. 來源詞在當地不常用,一般接受度不高
  2. 目標詞在當地常用,接受度高
  3. 能夠合理避免常見的誤轉換(否則需考慮增加更多相關詞以避免誤轉,或寧可捨棄)

表中許多項目並不太符合,例如「管道」「通道」在台灣都常用,只是意義不同,而且我似乎沒怎麼看過前者適合換成後者的實例,或許需要舉出幾個具體用例。

「命令」「指令」、「列表」「清單」、「示例」「範例」、「主頁」「首頁」、「通過」「透過」在台灣都很常用,有時因上下文會有細微的差異,基本上不符合1,我不認為有需要列入,以免過度轉換徒增困擾。

「計算機」「電腦」、「對像」「物件」在台灣有不同的用法和意義,如果沒有配套詞組,前者一律轉成後者會是大災難。

「匹配」「對應」兩者幾乎無關,前者比較偏向 match,後者是…corresponding?

最近不太有空,以上先聊舉數例做個起頭,認真檢討的話應該還有很多可以說……

RUI-LONG commented 4 months ago

感謝 danny0838的建議,正如您所言,確實有些例子的泛用性不足。 上述新增的字詞,都是在GPT翻譯過程中,經常被錯誤使用的詞彙,因此加以補充。

謝謝您的指教😊 (這次的PR我先關掉,之後有緣有閒再推一版更新的~)

BYVoid commented 3 weeks ago

很遺憾OpenCC識別上下文的能力不足,對於特別常見,尤其是臺灣大陸都經常出現的詞彙,不建議加入。