CNMan / UnicodeCJK-WuBi06

新世纪版五笔字型超大字符集编码
https://06wb.github.io/
156 stars 37 forks source link

香港增补字符集(HKSCS) #38

Closed CNMan closed 5 years ago

CNMan commented 5 years ago

https://www.ogcio.gov.hk/tc/our_work/business/tech_promotion/ccli/hkscs/

可以认为是香港的BIG5补集,最新版本为《香港增补字符集-2016》,共收录5033个字符,汉字4602个。

根据 https://www.unicode.org/Public/zipped/11.0.0/Unihan.zipUnihan_IRGSources.txt统计,共17664字具有kIRG_HSource属性,其中13062字是BIG5字符集已有的,剩余4602个:

但根据 https://www.unicode.org/Public/zipped/11.0.0/Unihan.zipUnihan_OtherMappings.txt统计,共有4579字具有kHKSCS属性,其中3字不在上述具有kIRG_HSource属性的字符之列:

U+3D1D  㴝
U+4CA4  䲤
U+2F9B2 䕫

因此,还有26个具有kIRG_HSource属性的字不具kHKSCS属性

U+5151  兑
U+543F  吿
U+5AAA  媪
U+60A6  悦
U+6120  愠
U+635D  捝
U+655A  敚
U+68C1  棁
U+6C32  氲
U+6D9A  涚
U+7174  煴
U+7A0E  税
U+7DFC  緼
U+8131  脱
U+817D  腽
U+85F4  藴
U+8715  蜕
U+8AAC  説
U+8F3C  輼
U+9196  醖
U+92ED  鋭
U+95B2  閲
U+9C47  鱇
U+9FD0  鿐
U+270F0 𧃰
U+2A3ED 𪏭

再对照 https://www.ogcio.gov.hk/tc/our_work/business/tech_promotion/ccli/hkscs/doc/HKSCS2016.json 可以发现:

U+3D1D  㴝 //不在HKSCS2016.json中
U+4CA4  䲤 //不在HKSCS2016.json中
U+2F9B2 䕫 //在HKSCS2016.json中
U+9FD0  鿐 //在HKSCS2016.json中
U+270F0 𧃰 //不在HKSCS2016.json中
U+2A3ED 𪏭 //在HKSCS2016.json中

因此应是Unicode资料有误,或需要更新。

另:

感謝提供資料,沒有包括在JSON檔案內的四個《香港增補字符集-2016》字符為,,及,我們正在研究是否有需要對JSON檔案或香港增補字符集文件作出修改,謝謝。

H-8862  F325             <00CA,0304>
H-8864  F327             <00CA,030C>
H-88A3  F344             <00EA,0304>
H-88A5  F346             <00EA,030C>
CNMan commented 5 years ago

http://code.web.idv.hk/hkscs/hkscs.php

此外,3 個原來存在於 GCCS 字集內,但因「未能查實出處」而沒有被納入到 HKSCS 的字,現已進入了 Unicode,分別為 U+2B473 𫑳 (H-9FB1)、U+2AE67 𪹧 (H-A057) 和 U+2DF3C 𭼼 (H-A062)。