BYVoid / OpenCC

Conversion between Traditional and Simplified Chinese
https://opencc.byvoid.com/
Apache License 2.0
8.3k stars 974 forks source link

scheme 對「并」、「幷」的定義矛盾 #857

Open danny0838 opened 3 months ago

danny0838 commented 3 months ago

按照 variant.txt幷 并 幷,顯示「幷」為正體,「并」為其異體;而按照 ts_multi.txt并 並 併 并,顯示「并」為正體,「幷」非正體,二者是矛盾的。

應該要嘛是取「并」為正體,要嘛是取「幷」為正體,要嘛是二者各自皆為正體。

根據目前查幾個字典的結果看來,「幷」是比較古的字形,比較偏向作為地名、人名,意義較狹。「并」是比較新的字形,又恰好是中國標準的簡化字,因此更常作為「並」、「併」的簡化字使用。但大體而言,二者意義幾乎是相等且可以互相代換的,似乎不太適合都認定為正體。

可能要做個決定如何處理二者:如果取「并」為正體,則 variant.txt 要修改;如果取「幷」為正體,則 ts_multi.txtSTCharacters.txtTSCharacters.txt 都要修改;如果二者皆取為正體,則 variant.txtts_multi.txtSTCharacters.txtTSCharacters.txt 都要修改。以和既有詞表相容的角度來看,取「并」為正體是修改量最小的,但不一定最「正確」就是。

BYVoid commented 3 weeks ago

variant.txt 沒有明確定義哪個字是正體