tongwentang / tongwen-dict

MIT License
75 stars 9 forks source link

簡轉繁辭庫怪怪的 #8

Open niseloli opened 2 years ago

niseloli commented 2 years ago

牡丹花屏风还留在那里→牡丹破圖風還留在那裡 体内存有的大量灵力→體記憶體有的大量靈力 新技能疾风双击→新技能疾風連按兩下 林熙文本来要走了→林熙文字來要走了 像被丘比特射中了心→像被丘位元射中了心 大半角被削掉→大半形被削掉 上面只写了一句话→上面唯寫了一句話 商人乔布尔发布悬赏→商人喬布林值發佈懸賞 危机被小优化解了→危機被小最佳化解了 一起走回车站→一起走Enter站 接了这么多任务→接了這麼多工 跟着他的诡异步伐→跟著他的詭非同步伐 铁网卡着几根树枝→鐵網路卡著幾根樹枝 理查找到了管家→理尋找到了管家 世界面临的危机→世介面臨的危機 老高清理洞窟→老高畫質理洞窟 妹妹接口道:「他→妹妹介面道:「他 博客人一笑罢了→部落格人一笑罷了 计算法国之旅的费用→計演算法國之旅的費用 水泥干后把模板拆下→水泥干後把範本拆下

強烈建議簡轉繁辭庫預設只放那些處理「多字並一字」問題的詞 其他的都不要放 讓使用者自己加

t7yang commented 2 years ago

時下同類型的工具沒有一個可以產出完美的結果 在同樣的目標下,轉得太少就失去了本地化的意義 轉得太多自然就容易發生過度轉化的問題

感謝你的建議,但我不會採納 這個 issue 會轉移到辭庫的 repo 有任何相關的問題也請到辭庫的 repo 回報 協助我們改善過度轉化的問題

t7yang commented 2 years ago

@zhtw2013 有時間的話再麻煩你看看是否補充或修正這些過度轉換的問題 感謝

niseloli commented 2 years ago

比起失去本地化的意義 轉換後就讓人看不懂了才是大問題吧 而且繁體字又不是只有台灣人在用 你的本地化也不見得是人家的本地化

我的建議是直接把 it.s2t.ts 刪了或者全部轉註解 中國的IT相關詞彙翻譯都很直白 也就是說那些詞彙在其他無關IT的語句中也會出現 基本上都是會出現過度轉換的情形 不適合放在預設詞庫

yanrs17 commented 2 years ago

我覺得或者在設置裡添加一個選項,可以讓用戶自行選擇是否在簡繁轉換只上是否還要轉換用詞,還是只轉換簡繁。默認開啟,然後用戶可以選擇關閉這樣

t7yang commented 2 years ago

更細緻化的選項一直都在我的藍圖中,我幾年前就有規劃了,未來會慢慢新增 但是現實就是整個專案只有我一個人開發 我要休息、我要娛樂、我要耍廢、我還有其他專案想做 我沒有這麼多時間去把所有東西一步到位全部做好 所以請諒解

至於在地化這件事情,一直都是這個套件最重要的宗旨 如果覺得目前的效果不完善、不符合期待 市面上也有其他類似的套件在做一樣事情 不妨先移步過去用

kanasimi commented 1 year ago

小弟是Chinese_converter的維護者 據小弟的經驗 中國大陸資訊專有名詞常有錯誤替換的情況 https://github.com/kanasimi/CeJS/blob/master/extension/zh_conversion/corrections_to_TW.txt#L127 除非像Chinese_converter以語句分析 否則許多恐怕不適合直接替換 供您參考