Open danny0838 opened 4 years ago
官方取「尸竹尸竹竹」的不是「羽」,而是「𦏲」。官方五代沒有支持「尸竹尸竹竹」的「羽」字形,且增加兼容會增加取碼,所以不打算兼容。
「髙」字有兩種可能的取法。 取法一:卜卜卜中月口,共六碼 取法二,戈尸中月口,共五碼 考慮到「乍」取了「竹尸」而沒有取「人卜卜」,最終選擇了取法二。
「老」被官方手冊認定為連體,但「差」可以從「廿竹一」的取法看出是分體,兩者的確有些矛盾。 但是,「老」字無論看成是分是連,「耋」等字都可以得出同樣的「十心一戈土」的取碼,因此影響很小。 所以我還沒有決定將「老」看成分體還是連體。但出於兼容性,「差」等字是視作分體的。
「𬻞」、「𠁁」等字定為難字取「月難一」、「口難一」有官方字例。
官方有「𠆋」取「卜難人一口」,這是我類推「齊」難字的原因,但未和官方討論過。
官方取「尸竹尸竹竹」的不是「羽」,而是「𦏲」。官方五代沒有支持「尸竹尸竹竹」的「羽」字形,且增加兼容會增加取碼,所以不打算兼容。
瞭解。我對不設兼容沒意見,但希望能把這些「因字形而有取碼差異,但官方未支援,且考量重碼問題而決定不加兼容碼」的字形記錄下,以便日後查詢。記得這類字應該還有:今、卑、之類。
「髙」字有兩種可能的取法。 取法一:卜卜卜中月口,共六碼 取法二,戈尸中月口,共五碼 考慮到「乍」取了「竹尸」而沒有取「人卜卜」,最終選擇了取法二。
可以理解。但這裡主要是討論是否遇到「高」字形都要兼容「髙」及反之,或者看code charts或如何,這還是要規劃下。
「老」被官方手冊認定為連體,但「差」可以從「廿竹一」的取法看出是分體,兩者的確有些矛盾。 但是,「老」字無論看成是分是連,「耋」等字都可以得出同樣的「十心一戈土」的取碼,因此影響很小。 所以我還沒有決定將「老」看成分體還是連體。但出於兼容性,「差」等字是視作分體的。
即使認定為分體,應該還有⿱形與⿸形的差異,就結果論應該是視為⿸形(而不是像冖視為⿱形)。
「𬻞」、「𠁁」等字定為難字取「月難一」、「口難一」有官方字例。
請問官方字例是?我查不到官方碼表有「𬻞」、「𠁁」二字。
官方有「𠆋」取「卜難人一口」,這是我類推「齊」難字的原因,但未和官方討論過。
請問來源?我在漢文庫典、五代手冊都查不到官方碼表有「𠆋」字。
要類推我沒特別意見,文檔寫清楚就好。
「髙」和「高」,按Unicode文檔來,不類推。
輸入Unicode的字無法找到,看來漢文庫典的檢索功能有點問題......
既然官方也使用,繼續類推難字我個人無太大意見,文檔寫清楚即可。
「高/髙」是否類推我也無意見,但希望文檔寫上。
待議兼容方案
其他問題
「𭉋」「𮐗」的類「火」部分如何取碼?我目前取「大大」。
「齊」頭類字如「𮮻」、「𮮼」、「𮮺」是否皆類推視為「卜難」?文檔有說「龜」形字類推,但沒提到齊頭(似乎也沒問過官方?)我認為齊頭特徵不明顯,不易定義,且可能導致過度類推,加上齊頭字一般取碼通常也較無困難,因此建議改回,或兼容二者。
四疊字或六疊字如「𭷵」、「𭺔」、「𭻼」的取碼方案?上下分或左右分?或兼容?
「耂」、「⺶」視為分體或連體?官方「煮」取「十日火」,「⺶」找不到字例,但如果前者視為連體,更複雜的「⺶」沒理由不比照辦理。按此我都視為形勢上連體字。
難字是否視為複合字首?與其他字形相連時是否要斷開?如「𮚊」、「𮭴」、廌頭字「𰐆、𫋡、𫬅」等。