王码新世纪版五笔字型（原版码表）错误编码

CNMan / UnicodeCJK-WuBi06

新世纪版五笔字型超大字符集编码

https://06wb.github.io/

163 stars 37 forks source link

王码新世纪版五笔字型（原版码表）错误编码 #1

Open CNMan opened 6 years ago

CNMan commented 6 years ago

贴吧有人提出了一些：http://tieba.baidu.com/p/2572663303

本issue讨论请遵循以下格式：

输入法版本：
错误编码：

截至目前共修正王码大一统2018原版113字： CJK Unified Ideographs 区：	码位	字符	修正前
U+4FEB	俫	wgus	wgoy
U+51BA	冺	unna	unan
U+5221	刡	nnaj	najh
U+541B	君	vtkd	vtkf
U+5461	呡	knna	knan
U+561C	嘜	kswq	kswt
U+56FB	囻	lnna	lnav
U+578A	垊	fnna	fnan
U+59C4	姄	vnna	vnan
U+5E7E	幾	xxdy	xxaw
U+5ED0	廐	orxq	ovcq
U+5EF6	延	thpd	thpv
U+5F67	彧	gkgy	akgy
U+600B	怋	nnna	nnan
U+60FD	惽	nnnj	nnaj
U+616D	慭	gusn	godn
U+653A	攺	nnty	nty
U+6543	敃	nnat	naty
U+656F	敯	nnac	najc
U+662C	昬	nnaj	najf
U+668B	暋	nnaj	natj
U+6711	朑	muan	eann
U+6725	朥	muoe	eooe
U+68BE	梾	sgus	sgoy
U+6A69	橩	soof	soow
U+6BCE	毎	txfj	txff
U+6C17	気	rnri	rnru
U+6C1C	氜	rnjd	rnjf
U+6E63	湣	innj	inaj
U+6F40	潀	ilwy	ilww
U+6F48	潈	itle	iley
U+6FF9	濹	ijff	ilff
U+7449	瑉	gnnj	gnaj
U+773E	眾	lwwy	lwww
U+776F	睯	nnah	nath
U+7A0C	稌	twfi	twgs
U+7A36	稶	tgky	taky
U+7B22	笢	tnna	tnab
U+7C64	籤	twwy	twwg
U+7CB5	粵	tmtn	tltn
U+7DE1	緡	xnnj	xnaj
U+7E96	纖	xwwy	xwwg
U+7F60	罠	lnna	lnab
U+7F90	羐	ghhy	hghy
U+7F97	羗	ugnc	ufqc
U+80A6	肦	muwv	ewvt
U+80CA	胊	muqk	eqkg
U+80D0	胐	mubm	ebmh
U+8101	脁	muqi	eqiy
U+8127	脧	muct	ecwt
U+81A7	膧	muuf	eujf
U+81EE	臮	thwy	thww
U+8643	虃	aiwy	aiwg
U+8723	蜣	jugn	jufq
U+87C1	蟁	nnaj	najj
U+891D	褝	puil	puul
U+8973	襳	puwy	puwg
U+89F0	觰	qmfj	qehj
U+89F4	觴	qmfr	qehr
U+8B96	讖	ywwy	ywwg
U+903A	逺	fnwp	fnep
U+9060	遠	fkwp	fkep
U+9231	鈱	qnna	qnan
U+9372	鍲	qnnj	qnaj
U+946F	鑯	qwwy	qwwg
U+97F1	韱	wwgy	wwag
U+98E0	飠	wyu	wyty
U+9D16	鴖	nnao	nawo
U+9EA5	麥	swwq	swwt
U+9EB8	麸	gqfw	gtfw
U+9EB9	麹	gqqo	gtqo
U+9EBA	麺	gqdd	gtdd

CJK Unified Ideographs Extension A 区：	码位	字符	修正前
U+342A	㐪	gbwi	ybwu
U+35C3	㗃	knnj	knaj
U+36F0	㛰	vnnj	vnaj
U+37E9	㟩	nnam	natm
U+37ED	㟭	mnnj	mnaj
U+3868	㡨	mhwy	mhwg
U+38AF	㢯	xnna	xnan
U+38E3	㣣	tdww	tdty
U+3978	㥸	nnan	naln
U+39D1	㧑	ryey	ryty
U+3A09	㨉	rnnj	rnaj
U+3AC4	㫄	fqyr	yqyr
U+3B06	㬆	jnnj	jnaj
U+3B8C	㮌	sdmj	sdmd
U+3C1D	㰝	nnqw	nqwy
U+3C7C	㱼	nnwc	nwcy
U+3CE4	㳤	iuay	iyai
U+3CFD	㳽	ixti	ixqi
U+3EB2	㺲	gnfg	gnhf
U+4055	䁕	hnnj	hnaj
U+40A5	䂥	dnna	dnan
U+40C9	䃉	dnnj	dnaj
U+41C7	䇇	unna	unan
U+4200	䈀	tmmj	tmaj
U+42A8	䊨	ynky	ynkw
U+42CB	䋋	xnna	xnan
U+43D3	䏓	mufq	efqn
U+43D4	䏔	enfg	enhf
U+4443	䑃	muae	eape
U+45A1	䖡	jnfg	jnhf
U+46BC	䚼	ynfg	ynhf
U+46C9	䛉	ynna	ynan
U+46DD	䛝	ynfm	ynhm
U+4851	䡑	lnna	lnan
U+4951	䥑	qswq	qswt
U+4A2B	䨫	fswq	fswt
U+4AB8	䪸	nnam	nadm
U+4BAE	䮮	cosq	cost
U+4D3B	䴻	tqtq	tqtt
U+4D45	䵅	gqtq	gqtt

CJK Compatibility Ideographs 区：	码位	字符	修正前	修正后
U+FA24	﨤	byyp	bypi

CNMan commented 6 years ago

输入法版本：2018

有52个字输出后是PUA区码位字符，Windows 10 默认字体“微软雅黑”等均无法正常显示建议：字符集设置为“GB18030-2000(27533字)”后，输出CJK和CJK－A区码位字符

U+E81A        㑳    U+3473    wqbt    1
U+E81B        㑇    U+3447    wqvg    1
U+E81F        㖞    U+359E    kkmw    1
U+E820        㘚    U+361A    kunt    2
U+E821        㘎    U+360E    kunt    1
U+E824        㥮    U+396E    nqbt    1
U+E825        㤘    U+3918    nqvg    1
U+E827        㧏    U+39CF    rmry    2
U+E828        㧟    U+39DF    rian    1
U+E829        㩳    U+3A73    rwyc    4
U+E82A        㧐    U+39D0    rccy    1
U+E82D        㭎    U+3B4E    smry    1
U+E82E        㱮    U+3C6E    gqkm    3
U+E82F        㳠    U+3CE0    idpy    1
U+E834        䁖    U+4056    hovg    1
U+E835        䅟    U+415F    tcde    2
U+E837        䌷    U+4377    xmg    2
U+E83C        䎱    U+43B1    dilx    2
U+E83D        䎬    U+43AC    dilc    1
U+E83F        䏝    U+43DD    efny    1
U+E840        䓖    U+44D6    apwe    1
U+E841        䙡    U+4661    pukm    2
U+E842        䙌    U+464C    pukm    3
U+E844        䜣    U+4723    yrh    2
U+E845        䜩    U+4729    yako    2
U+E846        䝼    U+477C    mgeg    2
U+E847        䞍    U+478D    mgeg    3
U+E849        䥇    U+4947    qynn    3
U+E84A        䥺    U+497A    qaht    3
U+E84B        䥽    U+497D    qnty    2
U+E84C        䦂    U+4982    qynn    4
U+E84D        䦃    U+4983    qafj    3
U+E84E        䦅    U+4985    qugk    2
U+E84F        䦆    U+4986    qhhc    2
U+E850        䦟    U+499F    uwwf    4
U+E851        䦛    U+499B    uqvh    3
U+E852        䦷    U+49B7    uwwf    5
U+E853        䦶    U+49B6    uqvh    4
U+E856        䲣    U+4CA3    haqt    1
U+E857        䲟    U+4C9F    qgqb    1
U+E858        䲠    U+4CA0    qgdj    2
U+E859        䲡    U+4CA1    qgug    4
U+E85A        䱷    U+4C77    haqt    2
U+E85B        䲢    U+4CA2    eudg    3
U+E85C        䴓    U+4D13    gmhg    2
U+E85D        䴔    U+4D14    ywrg    2
U+E85E        䴕    U+4D15    gqjg    2
U+E85F        䴖    U+4D16    geqg    1
U+E860        䴗    U+4D17    hdyg    1
U+E861        䴘    U+4D18    rhag    2
U+E862        䴙    U+4D19    nkug    1
U+E863        䶮    U+4DAE    dxyd    2

有2518字未列入小写编码候选，强制大写编码才能输入，其中三码字117个、四码字2401个建议：列入小写编码候选，不要强制大写编码 3mazi.txt 4mazi.txt

CNMan commented 6 years ago

以下错误由新世纪五笔 QQ群38021162成员漢提供，代为整理如下：

依：

7F8C    羌      ufqb
5534    唴      kufq
7437    琷      gufq
9313    錓      qufq
36E8    㛨      vufq
3CFE    㳾      iufq

以下应修改为：

7F97    羗      ugnc ufqc
8723    蜣      jugn jufq

依：

6765    来      goi
5D03    崃      mgoy
5F95    徕      tgoy
6D9E    涞      igoy
7750    睐      hgoy
94FC    铼      qgoy

以下应修改为：

4FEB    俫      wgus wgoy
616D    慭      gusn godn
68BE    梾      sgus sgoy

依：

4E11    丑      nhfd
541C    吜      knhf
599E    妞      vnhf
5FF8    忸      nnhf
626D    扭      rnhf
677B    杻      snhf
6C91    沑      inhf
7084    炄      onhf
7C88    粈      onhf
7D10    紐      xnhf
7EBD    纽      xnhf
9215    鈕      qnhf
94AE    钮      qnhf

以下应修改为：

3EB2    㺲      gnfg gnhf
43D4    䏔      enfg enhf
45A1    䖡      jnfg jnhf
46BC    䚼      ynfg ynhf
46DD    䛝   ynfm    ynhm

依：

4E3A    为   ytny
4F2A    伪   wyty
59AB    妫   vyty
6CA9    沩   iyty

以下应修改为：

39D1    㧑   ryey    ryty

依：

5B45    孅      vwwg
61FA    懺      nwwg
6515    攕      rwwg
6AFC    櫼      swwg
7038    瀸      iwwg
8C36    谶   ywwg
40F8    䃸      dwwg
418E    䆎      twwg
42B1    䊱      owwg
444E    䑎      ewwg
460B    䘋      jwwg

以下应修改为：

7C64    籤   twwy    twwg
7E96    纖   xwwy    xwwg
8643    虃   aiwy    aiwg
8973    襳   puwy    puwg
8B96    讖   ywwy    ywwg
946F    鑯   qwwy    qwwg
97F1    韱   wwgy    wwag
3868    㡨   mhwy    mhwg

CNMan commented 6 years ago

与新世纪五笔拆分表-v1.0 by 熊怀东不一致的

苠   anna    anab    1
珉   gnna    gnan    1
眠   hnna    hnan    1
泯   inna    inan    1
岷   mnna    mnan    1
愍   nnan    natn    1
民   nnav    nav 1
抿   rnna    rnan    1
㮌   sdmd    sdmj    2  更新错了
稌   twgs    twfi    1  更新错了
缗   xnnj    xnaj    1
飠   wyty    wyu 3  更新错了

依：

6C11    民   nav
7F17    缗   xnaj

以下应修改为：

35C3    㗃   knnj    knaj
36F0    㛰   vnnj    vnaj
37ED    㟭   mnnj    mnaj
3A09    㨉   rnnj    rnaj
3B06    㬆   jnnj    jnaj
4055    䁕   hnnj    hnaj
40C9    䃉   dnnj    dnaj
60FD    惽   nnnj    nnaj
656F    敯   nnac    najc
662C    昬   nnaj    najf
6E63    湣   innj    inaj
7449    瑉   gnnj    gnaj
7DE1    緡   xnnj    xnaj
9372    鍲   qnnj    qnaj
38AF    㢯   xnna    xnan
3978    㥸   nnan    naln
40A5    䂥   dnna    dnan
41C7    䇇   unna    unan
42CB    䋋   xnna    xnan
46C9    䛉   ynna    ynan
4851    䡑   lnna    lnan
4AB8    䪸   nnam    nadm
51BA    冺   unna    unan
5221    刡   nnaj    najh
5461    呡   knna    knan
56FB    囻   lnna    lnav
578A    垊   fnna    fnan
59C4    姄   vnna    vnan
600B    怋   nnna    nnan
6543    敃   nnat    naty
7B22    笢   tnna    tnab
7F60    罠   lnna    lnab
87C1    蟁   nnaj    najj
9231    鈱   qnna    qnan
9D16    鴖   nnao    nawo
37E9    㟩   nnam    natm
3C1D    㰝   nnqw    nqwy
3C7C    㱼   nnwc    nwcy
653A    攺   nnty    nty
668B    暋   nnaj    natj
776F    睯   nnah    nath

依

6BCC    毌   xfd

以下应修改为

6BCE    毎   txfj    txff

其他需要修正的

5EF6    延      thpd thpv
7F90    羐   ghhy    hghy
42A8    䊨   ynky    ynkw
89F0    觰   qmfj    qehj
89F4    觴   qmfr    qehr
5F67    彧   gkgy    akgy
7A36    稶   tgky    taky
342A    㐪   gbwi    ybwu
38E3    㣣   tdww    tdty
6A69    橩   soof    soow
4200    䈀   tmmj    tmaj
3CFD    㳽   ixti    ixqi
6FF9    濹   ijff    ilff
891D    褝   puil    puul
903A    逺   fnwp    fnep
9060    遠   fkwp    fkep
6711    朑   muan    eann
6725    朥   muoe    eooe
80A6    肦   muwv    ewvt
80CA    胊   muqk    eqkg
80D0    胐   mubm    ebmh
8101    脁   muqi    eqiy
8127    脧   muct    ecwt
81A7    膧   muuf    eujf
43D3    䏓   mufq    efqn
4443    䑃   muae    eape
541B    君   vtkd    vtkf
7CB5    粵   tmtn    tltn
6F40    潀   ilwy    ilww
773E    眾   lwwy    lwww
81EE    臮   thwy    thww
6F48    潈   itle    iley
3AC4    㫄   fqyr    yqyr
5ED0    廐   orxq    ovcq
5E7E    幾   xxdy    xxaw

繁体简码错误的

工   AB  AA
芭   AB  AC
其   AB  AD
功   AB  AE
著   AB  AF
七   AB  AG
牙   AB  AH
匯   AB  AI
慭   GU  GO
觴   QM  QE

panqiincs commented 5 years ago

3CFD 㳽 ixti ixqi 891D 褝 puil puul

根据中华书局宋体显示的形态，这两个字应该选择前面的那个编码才对吧？

CNMan commented 5 years ago

@panqiincs 修改理由见 #41 ，字体需要改字形

BG5IJM commented 5 years ago

槑 kkss ksks

CNMan commented 4 years ago

@BG5IJM 本项目依中国大陆规范笔顺编码，容错码请自行添加

IT1187541749 commented 4 years ago

依: U+5DE6 左 daf U+53F3 右 dkf U+7070 灰 dou 以下应修改为: U+541B 君 vtkd vtkf

IT1187541749 commented 4 years ago

新世紀五筆超大字符集依:

\u4e3b  主   ygd
\u6237  户   yne
\u6c38  永   ynii
\u826f  良   yvei

以下应修改为:

\U0002a70a  𪜊   ynb ynv
\U0002d6a5  𭚥   ynb ynv
\U0002ceff  𬻿   yyu yyi

IT1187541749 commented 4 years ago

新世紀五筆超大字符集依: \u56e7 囧 mwmg

以下应修改为: \U00021738 𡜸 lwmv mwmv

IT1187541749 commented 4 years ago

新世紀五筆超大字符集依:

\u4e02  丂   gnv
\U00020001  𠀁   gnv

为下应修改为: \U000239b6 𣦶 gnni gnnv

IT1187541749 commented 4 years ago

新世紀五筆超大字符集依:

\U00020991  𠦑   yaii
\U00026bc2  𦯂   ayai
\U0002769b  𧚛   yaie
\U000251b3  𥆳   yaih

以下应修改为:

\U00028055  𨁕   khyy    khyi
\U00021a1c  𡨜   pyay    pyai
\U0002348f  𣒏   syay    syai
\U000234d9  𣓙   suai    syao

IT1187541749 commented 4 years ago

新世纪五笔超大字符集依: 粛 vojk 笔顺:51124313432 拆分为字根:⺕+米+丿丨+识别码K 拆分与笔顺相同,无问题.

肃 vijk 笔顺:51123234 拆分为字根:⺕+小+丿丨+识别码K 拆分与笔顺不同,但是很直观,肃的最后两笔是丿与丶,肃取的是字根的末笔,由此可见不一定要完全按笔顺,如果完全按笔顺会造成相同类型的字拆分相互冲突.

以下应修改为:

\u6bd0  毐   fxdf    fxdr
\u6bcb  毋   xdd xde
\u6bce  毎   txff    txfj
\u6bcc  毌   xfd xfk
\u2f4f  ⽏   xfd xfk
\U000233ed  𣏭   sxdf    sxdr
\U0002a788  𪞈   wxff    wxfj
\U00023aec  𣫬   xgjk    xak

修改理由: 以上带𠂇这个字根的字虽然与戎字不相同,但是它们采用了同一个字根𠂇,在取识别码上应该采用同样的规则.

戎与毋都用到了𠂇这个字根,都不足四码,由于笔顺问题导致它们取的识别码不同,戎取的是𠂇这个字根中的丿,而毋取的是𠂇这个字根中的一. 带十这个字根的字同样也应该按字根的末笔取识别码,如华字,字根是十,先一后丨,参考:华 wxfj.

字根相同笔顺不同的字还有肃与粛,它们的笔顺不同,但是取的识别码相同.

粛 vojk 笔顺:51124313432

拆分为字根:⺕+米+丿丨+识别码K 拆分与笔顺相同,无问题.

肃 vijk 笔顺:51123234

拆分为字根:⺕+小+丿丨+识别码K 笔顺为:⺕+丨+丿丨+丿丶拆分与笔顺不同,但是很直观,肃的最后两笔是丿与丶,但是它取的识别码是J上的字根丿丨的末笔丨,杂合结构所以取K,由此可见取识别码不一定要完全按笔顺取汉字的末笔,如果完全按笔顺取末笔会造成相同类型的字拆分相互冲突.

GB18030-2000字符集有27533个汉字,超大字符集更多,如果按笔顺取识别码的话近十万汉字,请问各位能记住多少汉字的笔顺?这么多汉字中有些相同类型的字因为笔顺问题导致这种相似的字取码不同,要想完全拆正确就得了解所有汉字的笔顺,我想没有人能记得住吧.

因此我建议取末笔识别码应该取最后一个字根的末笔,而不是汉字笔顺的末笔,识别码取字根笔顺中的末笔我想所有人应该都能记住字根的笔顺,如果取汉字的笔顺中的末笔为识别码,近十万汉字又有多少人能记住笔顺?超大字符集中有些字非常奇怪,它的笔顺可能与你所想的完全不一样,同时相同类型的字笔顺也不一样. 如下面的字:

\U00020991  𠦑   yaii
\U00026bc2  𦯂   ayai
\U0002769b  𧚛   yaie
\U000251b3  𥆳   yaih

\U00028055  𨁕   khyy    khyi
\U00021a1c  𡨜   pyay    pyai
\U0002348f  𣒏   syay    syai
\U000234d9  𣓙   suai    syao

取字根的末笔当识别码的好处就是不用知道当前所拆汉字笔顺,只需要知道它的字根笔顺就能取识别码,简单易记,同时字根的笔顺与大部汉字的笔顺是完全一样的,只有少量汉字的笔顺与字根笔顺不符,所以为了拆字更简单,取识别码应该取字根的末笔,而不是汉字笔顺的末笔.

取最后一个字根的末笔做识别码既符合大部分汉字的笔顺又能能兼容少部分汉字笔顺不正常的问题,可谓是一举多得呀.

重要的事情说三遍: 因此我建议取末笔识别码应该取最后一个字根的末笔,而不是汉字笔顺的末笔. 因此我建议取末笔识别码应该取最后一个字根的末笔,而不是汉字笔顺的末笔. 因此我建议取末笔识别码应该取最后一个字根的末笔,而不是汉字笔顺的末笔.

IT1187541749 commented 4 years ago

新世纪五笔超大字符集依: \u4e9e 亞 gfgd

以下应修改为:

\u34f8  㓸   nngj    anfj
\u65b2  斲   nngr    anfr
\U00028ec9  𨻉   bnng    bang
\U0002525d  𥉝   hnng    hang
\U0002cede  𬻞   mnng    mggg
\U00028739  𨜹   nngb    anfb
\U00027790  𧞐   nnge    anfe
\U00020041  𠁁   nngg    anfg
\U00029521  𩔡   nngm    anfm
\U00027878  𧡸   nngq    anfq
\U00028a90  𨪐   qnng    qang
\U000217f3  𡟳   vnng    vang
\U00020344  𠍄   wnng    wang
\U00027aa7  𧪧   ynng    yang

修改理由: 𠁁㓸斲这一类字从字形上来看与亞这个字非常相似,而F上有亞中这个字根,因此我认为𠁁㓸斲这一类字应该拆为: 匚+尸无丿+亞中 这样更为直观,虽然笔顺很好,但是并不是每一个人都非常了解笔顺,当看到一个字时五笔用户想到的是字根,看到上面那些字时也会第一时间想到亞中这个字根,所以应该拆为ANF,为了兼顾直观而没有按笔顺拆的字:

\u4e9e  亞   gfgd
\u5f0f  式   aayi
\u8bd5  试   yaay
\u8a66  試   yaay
\u56fd  国   lgyi
\u5f67  彧   akgy
\u97f1  韱   wwag

以下为新世纪五笔教程完整版中的原话.

(3) 兼顾直观 
在编码时，为了使码元特征明显易辨，有时就要暂时牺牲“书写顺序”和“取大优先” 的原则，形成个别例外的情况。

IT1187541749 commented 4 years ago

以下错误由新世纪五笔 QQ群38021162成员V⑤勇敢发现，代为整理如下：

新世纪五笔超大字符集

依:

\u5ec4 廄 ovcc

为下应修改为:

\u5ed0 廐 orxq ovcq

修改理由: 因不同字源导致的错误,应当修改为大陆G源字形. TIM图片20200306020335

TIM图片20200306014159

CNMan commented 4 years ago

新世纪五笔超大字符集依: \u4e9e 亞 gfgd

以下应修改为:
\u34f8    㓸   nngj    anfj
\u65b2    斲   nngr    anfr
\U00028ec9    𨻉   bnng    bang
\U0002525d    𥉝   hnng    hang
\U0002cede    𬻞   mnng    mggg
\U00028739    𨜹   nngb    anfb
\U00027790    𧞐   nnge    anfe
\U00020041    𠁁   nngg    anfg
\U00029521    𩔡   nngm    anfm
\U00027878    𧡸   nngq    anfq
\U00028a90    𨪐   qnng    qang
\U000217f3    𡟳   vnng    vang
\U00020344    𠍄   wnng    wang
\U00027aa7    𧪧   ynng    yang
修改理由: 𠁁㓸斲这一类字从字形上来看与亞这个字非常相似,而F上有亞中这个字根,因此我认为𠁁㓸斲这一类字应该拆为: 匚+尸无丿+亞中 这样更为直观,虽然笔顺很好,但是并不是每一个人都非常了解笔顺,当看到一个字时五笔用户想到的是字根,看到上面那些字时也会第一时间想到亞中这个字根,所以应该拆为ANF,为了兼顾直观而没有按笔顺拆的字:
\u4e9e    亞   gfgd
\u5f0f    式   aayi
\u8bd5    试   yaay
\u8a66    試   yaay
\u56fd    国   lgyi
\u5f67    彧   akgy
\u97f1    韱   wwag
以下为新世纪五笔教程完整版中的原话.
(3) 兼顾直观 
在编码时，为了使码元特征明显易辨，有时就要暂时牺牲“书写顺序”和“取大优先” 的原则，形成个别例外的情况。 

这类字不是笔顺的问题，而是其中的“左筐”是两笔形成还是三笔形成

CNMan commented 4 years ago

新世纪五笔超大字符集依: 粛 vojk 笔顺:51124313432 拆分为字根:⺕+米+丿丨+识别码K 拆分与笔顺相同,无问题.

肃 vijk 笔顺:51123234 拆分为字根:⺕+小+丿丨+识别码K 拆分与笔顺不同,但是很直观,肃的最后两笔是丿与丶,肃取的是字根的末笔,由此可见不一定要完全按笔顺,如果完全按笔顺会造成相同类型的字拆分相互冲突.

以下应修改为:
\u6bd0    毐   fxdf    fxdr
\u6bcb    毋   xdd xde
\u6bce    毎   txff    txfj
\u6bcc    毌   xfd xfk
\u2f4f    ⽏   xfd xfk
\U000233ed    𣏭   sxdf    sxdr
\U0002a788    𪞈   wxff    wxfj
\U00023aec    𣫬   xgjk    xak
修改理由: 以上带𠂇这个字根的字虽然与戎字不相同,但是它们采用了同一个字根𠂇,在取识别码上应该采用同样的规则.

戎与毋都用到了𠂇这个字根,都不足四码,由于笔顺问题导致它们取的识别码不同,戎取的是𠂇这个字根中的丿,而毋取的是𠂇这个字根中的一. 带十这个字根的字同样也应该按字根的末笔取识别码,如华字,字根是十,先一后丨,参考:华 wxfj.

字根相同笔顺不同的字还有肃与粛,它们的笔顺不同,但是取的识别码相同.

粛 vojk 笔顺:51124313432

拆分为字根:⺕+米+丿丨+识别码K 拆分与笔顺相同,无问题.

肃 vijk 笔顺:51123234

拆分为字根:⺕+小+丿丨+识别码K 笔顺为:⺕+丨+丿丨+丿丶拆分与笔顺不同,但是很直观,肃的最后两笔是丿与丶,但是它取的识别码是J上的字根丿丨的末笔丨,杂合结构所以取K,由此可见取识别码不一定要完全按笔顺取汉字的末笔,如果完全按笔顺取末笔会造成相同类型的字拆分相互冲突.

GB18030-2000字符集有27533个汉字,超大字符集更多,如果按笔顺取识别码的话近十万汉字,请问各位能记住多少汉字的笔顺?这么多汉字中有些相同类型的字因为笔顺问题导致这种相似的字取码不同,要想完全拆正确就得了解所有汉字的笔顺,我想没有人能记得住吧.

因此我建议取末笔识别码应该取最后一个字根的末笔,而不是汉字笔顺的末笔,识别码取字根笔顺中的末笔我想所有人应该都能记住字根的笔顺,如果取汉字的笔顺中的末笔为识别码,近十万汉字又有多少人能记住笔顺?超大字符集中有些字非常奇怪,它的笔顺可能与你所想的完全不一样,同时相同类型的字笔顺也不一样. 如下面的字:
\U00020991    𠦑   yaii
\U00026bc2    𦯂   ayai
\U0002769b    𧚛   yaie
\U000251b3    𥆳   yaih
\U00028055    𨁕   khyy    khyi
\U00021a1c    𡨜   pyay    pyai
\U0002348f    𣒏   syay    syai
\U000234d9    𣓙   suai    syao
取字根的末笔当识别码的好处就是不用知道当前所拆汉字笔顺,只需要知道它的字根笔顺就能取识别码,简单易记,同时字根的笔顺与大部汉字的笔顺是完全一样的,只有少量汉字的笔顺与字根笔顺不符,所以为了拆字更简单,取识别码应该取字根的末笔,而不是汉字笔顺的末笔.

取最后一个字根的末笔做识别码既符合大部分汉字的笔顺又能能兼容少部分汉字笔顺不正常的问题,可谓是一举多得呀.

重要的事情说三遍: 因此我建议取末笔识别码应该取最后一个字根的末笔,而不是汉字笔顺的末笔. 因此我建议取末笔识别码应该取最后一个字根的末笔,而不是汉字笔顺的末笔. 因此我建议取末笔识别码应该取最后一个字根的末笔,而不是汉字笔顺的末笔.

识别码应该取“字根末笔”还是“笔顺末笔”，建议再讨论，暂不修改。

IT1187541749 commented 4 years ago

以下来源于新世纪五笔超大字符集. 参考:

\u9fb9  龹   udi 
\u5377  卷   udbb
\u5708  圈   ludb
\U23cfe 𣳾   udiu    
\U2c1e6 𬇦   udiu    
\u990b  餋   udwe

以下应修改为:

\U2d402 𭐂   ufwf    ewff
\U2eb4e 𮭎   ufwo    udjo
\U2b7e9 𫟩   ufwp    udnp
\U20509 𠔉   wfwu    udi
\U2da45 𭩅   eufi    eudi
\U2da43 𭩃   euft    eudt
\U2dc8c 𭲌   iufd    iudd
\U2dc71 𭱱   iufd    iudd
\U2daef 𭫯   sufi    sudi
\U2b764 𫝤   ufwd    udgd
\U2e368 𮍨   ufwe    udef
\U2e362 𮍢   ufwf    udgf
\U2d456 𭑖   ufwh    udyh
\U2ea1f 𮨟   ufwm    udxm
\U2d72e 𭜮   ufwn    udnu
\U2d44a 𭑊   ufwu    uduu
\U2d151 𭅑   ufwx    udxb

参考:

\u723b  爻   rru 
\U2cf06 𬼆   rru 
\u2f58  ⽘   rru

可看做是两个X重叠.
以下应修改为:
\U2bb63 𫭣 ruff rrff

参考:
\u57c0 埀 tfuf 以下应修改为:
U+309D7 𰧗 dtgf dtff

参考:

\u98df  食   wyve
\u2edd  ⻝   wyve

以下应修改为: \u2fb7 ⾷ wyvu wyve

参考:

\u8671  虱   ntji
\u4eaa  亪   笔顺:4132345

下面一字修改理由为: 末笔为折而不是一捺,捺一般与其它笔划成对出现,类似繁体字中的八,而折一般单独出现.

\u4eaa 亪 yoyu yonb

IT1187541749 commented 4 years ago

以下来源于新世纪五笔超大字符集. 参考: 第一部分: 1. \U00020087 𠂇 dgt 笔顺 13

2.  \u5de6  左   daf 笔顺  13121
3.  \u53f3  右   dkf 笔顺  13251
4.  \u620e  戎   ade 笔顺  113534

5. \u6bcb 毋 xdd 笔顺 5531

总结1:上面都是用了"𠂇"这个字根的字,其中序号2-4字中的字根"𠂇"与序号1"𠂇"书写笔顺一致,笔顺是先"一"后"丿",同时它也是字根表中D上的字根"𠂇",而"毋"字中的字根"𠂇"的书写笔顺与键盘D上的字根"𠂇"不一致,是先"丿"后"一",由上面的字可以看出:"毋"字中的"𠂇"与字根"𠂇"笔顺不一致时不影响"毋"字使用字根"𠂇".

第二部分: 6. \u5341 十 fgh 笔顺 12

7.  \u4ec0  什   wfh 笔顺  3212
8.  \u6bd5  毕   xxfj    笔顺  153512
9.  \u771f  真   fhwu    笔顺  1225111134

10. \u6bcc  毌   xfd 笔顺  5521
11. \u8d2f  贯   xfmu    笔顺  55212534
12. \u8cab  貫   xfmu    笔顺  55212511134
13. \u60ef  惯   nxfm    笔顺  44255212534
14. \u6163  慣   nxfm    笔顺  44255212511134

总结2:上面都是使用了"十"这个字根的字,其中序号7-9字中的字根"十"与序号6"十"的书写笔顺一致,笔顺是先"一"后"丨",同时它也是字根表中F上的字根"十",而序号10-14字中使用到的字根"十"在序号10-14字中的书写笔顺与字根表F上的字根"十"不一致,书写顺序是先"丿"后"一",由上面的字可以看出序号10-14字中的"𠂇"与字根表F上的字根"十"笔顺不一致时不影响10-14字使用字根"十".

参考:

\u529b  力   ent 笔顺  53
\u4ec2  仂   wet 笔顺  3253

由上面得出的结论得出的结果来看,以下字也不应该受到笔顺的影响,以下是需要修改的部分: 以下字应修改为:

\u4e3a  为   ytny    yeyi    笔顺  4354
\u4f2a  伪   wyty    wyey    笔顺  324354
\u59ab  妫   vyty    vyey
\u6ca9  沩   iyty    iyey
\u39d1  㧑   ryty    ryey
\U00020be0  𠯠   kyty    kyey
\U00027e51  𧹑   myty    myey
\U0002b1ed  𫇭   ayty    ayey
\U0002cb36  𬬶   qyty    qyey

以下字在官方码表中"为"字之所以不用"力"这个字根是因为"为"中的"力"与字根"力"笔顺不一致,所以在"为"字没有采用"力"这个字根. 修改理由:以上的字中都含有"为"这个部件,而"为"中的部件"力"与字根表E上的字根"力"在字形上完全一样,区别只是笔顺不同,"力"是先"𠃌"后"丿",而"为"字中的"力"是先"丿"后"𠃌",由上面的总结1与总结2中得出的结论来看"为"也不应该受到书写笔顺的影响才对,不能因为"为"字中的"力"与汉字"力"或者说字根"力"的笔顺不一样而不用"力"这个字根,因此以上含有"为"这个部件的字都应该修改.

以下字的修改理由同上: 修改理由:"丑"字中的左下部分与字根表F上的字根"土"从字形上来看一样,因此下面这些字也不应受笔顺影响而不用字根"土". 所以以下字应修改为:

\u4e11  丑   nhfd    nfd
\u541c  吜   knhf    knfg
\u599e  妞   vnhf    vnfg
\u5ff8  忸   nnhf    nnfg
\u626d  扭   rnhf    rnfg
\u677b  杻   snhf    snfg
\u6a7b  橻   snhf    snff
\u6c91  沑   inhf    infg
\u7084  炄   onhf    onfg
\u7c88  粈   onhf    onfg
\u7d10  紐   xnhf    xnfg
\u7ebd  纽   xnhf    xnfg
\u9215  鈕   qnhf    qnfg
\u94ae  钮   qnhf    qnfg
\u3eb2  㺲   gnhf    gnfg
\u43d4  䏔   enhf    enfg
\u45a1  䖡   jnhf    jnfg
\u46bc  䚼   ynhf    ynfg
\u46dd  䛝   ynhm    ynfm
\U000202a3  𠊣   wnhf    wnff
\U0002070b  𠜋   wnhj    wnfj
\U00020d3e  𠴾   knhf    knff
\U000211b4  𡆴   lnhf    lnfd
\U000216bd  𡚽   nhfv    nfvg
\U00021946  𡥆   nhfb    nfbg
\U00021e06  𡸆   mnhm    mnfm
\U00023174  𣅴   jnhf    jnfg
\U00023516  𣔖   snhf    snff
\U0002429b  𤊛   onhf    onff
\U00024684  𤚄   tnhf    tnff
\U00024de8  𤷨   unhf    unff
\U00024fe5  𤿥   qnhc    qnfc
\U00024fee  𤿮   knhc    knfc
\U00024fff  𤿿   nhfc    nfnc
\U00025128  𥄨   hnhf    hnfg
\U00025766  𥝦   tnhf    tnfg
\U000257f7  𥟷   tnhf    tnff
\U00025ba2  𥮢   tnhf    tnff
\U00025ea3  𥺣   onhf    onff
\U0002673b  𦜻   enhf    enff
\U00026c6a  𦱪   anhf    anff
\U00027a56  𧩖   ynhf    ynff
\U000282c0  𨋀   lnhf    lnfg
\U0002851a  𨔚   nhfp    nfnp
\U0002867a  𨙺   nhfb    nfbh
\U000286c4  𨛄   nnhb    nnfb
\U00028708  𨜈   nhfb    nfnb
\U00028709  𨜉   nhfb    nfvb
\U00028cde  𨳞   unhf    unfd
\U00028fca  𨿊   cnhy    cnfy
\U00029467  𩑧   nhfm    nfdm
\U0002a72b  𪜫   wnhf    wnfg
\U0002c6e2  𬛢   nhfh    nfah

以下一字是大字符集中我认为没有编错的字,如果你们不认同我的观点,那对于你们来说下面一字就是错误的.

\U00022ba2 𢮢 rnff

以下是含有丑字未受影响未修改过的字:

\u7f9e  羞   ugnf
\u4087  䂇   cnhf
\u4d8a  䶊   thlf
\U0002501e  𥀞   ugnc
\U00025373  𥍳   cnhf
\U0002635f  𦍟   hghf
\U0002636e  𦍮   hghf
\U0002a160  𪅠   ugno
\U0002b161  𫅡   ugnk
\U0002a634  𪘴   hbnf
\U00027fd4  𧿔   khnf
\U00028093  𨂓   khnf
\U0002690a  𦤊   thnf

IT1187541749 commented 4 years ago

以下来源于新世纪五笔超大字符集. 参考:

从来面两张可以看出"冎"与"骨"字头非常相似,所以我认为可以把"冎"看做是"骨"字头的变体,把反"冎"看做是反"骨"字头的变体,在超集中有大量来源于其它地区的字,这些字采用的是当地的标准,可能会造成五笔拆分困难,所以我认为应该把"冎"与反"冎"看做是"骨"字头的变体,这样有利于拆分.

因此以下字应该修改为:

\u518e  冎   mnmb    mhnn
\u526e  剮   mnmj    mkjh
\u5368  卨   hmnk    hmkf
\u54bc  咼   mnmk    mkd
\u558e  喎   kmnk    kmkg
\u581d  堝   fmnk    fmkg
\u5aa7  媧   vmnk    vmkg
\u64be  撾   rmnp    rmkp
\u65e4  旤   mnmq    mkaq
\u6947  楇   smnk    smkg
\u6a9b  檛   smnp    smkp
\u6b44  歄   mnmw    mkqw
\u6e26  渦   imnk    imkg
\u6fc4  濄   imnp    imkp
\u7171  煱   omnk    omkg
\u7611  瘑   umnk    umkd
\u78a2  碢   dmnk    dmkg
\u7c3b  簻   tmnp    tmkp
\u7dfa  緺   xmnk    xmkg
\u8161  腡   emnk    emkg
\u81bc  膼   emnp    emkp
\u8435  萵   amnk    amkf
\u8596  薖   amnp    amkp
\u8778  蝸   jmnk    jmkg
\u8ae3  諣   ymnk    ymkg
\u904e  過   mnmp    mkpd
\u934b  鍋   qmnk    qmkg
\u9439  鐹   qmnp    qmkp
\u35fb  㗻   kmnp    kmkp
\u3890  㢐   omnk    omkd
\u4211  䈑   tmnk    tmkf
\u4ada  䫚   mnmm    mkdm
\U00020225  𠈥   wmnm    wmn
\U000202b0  𠊰   wmnk    wmkg
\U000203c0  𠏀   wmnp    wmkp
\U00020569  𠕩   mnmf    mrtf
\U000206f0  𠛰   mnmj    mjh
\U000209c5  𠧅   mnmf    mkrf
\U00020e6c  𠹬   mnmq    mkfq
\U0002145f  𡑟   fmnp    fmkp
\U000218a4  𡢤   vmnp    vmkp
\U0002197e  𡥾   bmnk    bmkg
\U00021e6c  𡹬   mmnk    mmkg
\U00021ea9  𡺩   mmnk    mmkf
\U00022778  𢝸   nmnk    nmkg
\U000228b8  𢢸   mnmn    mkan
\U000228c4  𢣄   nmnp    nmkp
\U000229d8  𢧘   mnma    mkay
\U00022c38  𢰸   rmnk    rmkg
\U00023058  𣁘   ymnk    ymkg
\U00023084  𣂄   mnmf    mkuf
\U000249d7  𤧗   gmnk    gmkg
\U00024ecc  𤻌   umnp    umkp
\U000250a1  𥂡   ymnl    ymkl
\U00025213  𥈓   hmnk    hmkg
\U000255a4  𥖤   dmnp    dmkp
\U00025801  𥠁   tmnk    tmkg
\U0002738f  𧎏   mnmj    mkjy
\U00027496  𧒖   jmnp    jmkp
\U00027df4  𧷴   wmnm    wmkm
\U00028029  𨀩   khmm    khmn
\U0002834b  𨍋   lmnk    lmkg
\U000284b5  𨒵   mnmp    mpi
\U000285f2  𨗲   amnp    amkp
\U000285f7  𨗷   smnp    smkp
\U00028d67  𨵧   umnk    umkd
\U0002a1b9  𪆹   mnmo    mkpo
\U0002ab0b  𪬋   mnmn    mknu
\U0002b0d3  𫃓   omnp    omkp
\U0002b44c  𫑌   mnmp    mkyp
\U0002b451  𫑑   mnmp    mkrp
\U0002c7ec  𬟬   mnmw    mhaw
\U0002ca55  𬩕   mghp    mktp
\U0002ca5f  𬩟   mghp    mkqp
\U0002ca67  𬩧   mghp    mkdp
\U0002d265  𭉥   mghw    mkyw
\U0002dd8f  𭶏   omgp    omkp

下面是含有"骨"字头或者"冎"字头未受影响的字:

\u9a27  騧   comk
\U00021ecb  𡻋   mmeg
\U00022157  𢅗   mhmp
\U000244d1  𤓑   mhjo
\U00029a12  𩨒   mewn
\U00029a33  𩨳   bmme
\U00029a46  𩩆   memg
\U00029a4d  𩩍   memn
\U0002fa08  䯎   mewf
\U0002d631  𭘱   mhme
\U0002e80a  𮠊   mybh

IT1187541749 commented 4 years ago

以下来源于新世纪五笔超大字符集. 参考:

\u9ea6  麦   gtu
\u9fcf  鿏   qgty
\u551b  唛   kgty

含有"麦"这个部件的字有很多是GT,而另一部分是GQ,有些从字形上看像"夕"另一些像"夂",还有一些像"处无卜",这样不利于学习,同时产生混淆,使人生不清应该是用GT还是GQ,所以应该统一一下,为什么不拆为GQ呢?因为有些字形是"处无卜",因为"夕"最后一点是出头的,与"夂"非常相似,你可以把"夕"当成"夂",但是你不能把"处无卜"当成"夕"来拆,所以全部统一修改为GT更好,(\U0002eb83 𮮃 gtci)这个字就是含有"处无卜"的字,因此以下含有"麦"这个部件的字应该修改为:

\u9eb8  麸   gqfw    gtfw
\u9eb9  麹   gqqo    gtqo
\u9eba  麺   gqdd    gtdd
\U0002ce4b  𬹋   gqjx    gtjx
\U0002ce4c  𬹌   gqwn    gtwn
\U0002ce4e  𬹎   gquk    gtuk

由上图可看出除了大陆字形是连在一起的之外港台都有分开的字形,同时是否相连除了放大细看之外不容易看清,为了利于拆分,应当把它当成"麦"来拆.

参考:

\U0002eb83 𮮃 gtci

所以以下两字应修改为:

\U0002b9ee  𫧮   dthi    gthi
\U0002c35e  𬍞   dtgy    gtgy

修改理由同上面两字一样,当成"王+夂"来拆,以下一字应该修改为:

\U0002a38d 𪎍 dthi gthi

参考:

\u7f91 羑 ugqy

以下字应该修改为:

\U000263c7 𦏇 uguy ugqy

以下是含有"麦"字未受影响的字:

\u9ea6  麦   gtu
\u9fcf  鿏   qgty
\u551b  唛   kgty
\U0002e2a2  𮊢   ugtu
\U0002eb87  𮮇   gtcg
\U0002eb86  𮮆   gtqn
\U0002eb85  𮮅   gtqw
\U0002eb84  𮮄   gtgn
\U0002eb83  𮮃   gtci
\U0002a31b  𪌛   gthn
\U0002a388  𪎈   gtay
\U0002a389  𪎉   gtmq
\U0002a38a  𪎊   gtit
\U0002a38b  𪎋   gthk
\U0002a38c  𪎌   gtgo
\U0002a38f  𪎏   gtpi
\U0002a390  𪎐   gtah
\U0002b711  𫜑   gtdh
\U0002b712  𫜒   gtpx
\U0002b713  𫜓   gtke
\U0002b714  𫜔   gtrf
\U0002ce45  𬹅   gtft
\U0002ce46  𬹆   gtaw
\U0002ce47  𬹇   gtfb
\U0002ce48  𬹈   gtie
\U0002ce49  𬹉   gtpq
\U0002ce4a  𬹊   gtaw
\U0002a165  𪅥   wyto
\U00026f06  𦼆   agty
\U000257c0  𥟀   tgty
\U00025aa3  𥪣   ucgt
\U00028310  𨌐   lgty
\U00028eae  𨺮   bcgt
\U00028e67  𨹧   bgty
\U00024ff2  𤿲   gthc
\U00026376  𦍶   ugtw
\U00020c8a  𠲊   kfty
\U0002ce4d  𬹍   gtad
\U0002da84  𭪄   sgty
\U0002dc17  𭰗   igty
\U0002de0c  𭸌   qtgt
\U0002e3c0  𮏀   agtu
\U0002e792  𮞒   gtpi
\U000249e1  𤧡   gfqb
\U00028afa  𨫺   qgtt
\U0002eb4f  𮭏   bgto
\U0002b715  𫜕   fpgt
\U0002e315  𮌕   mwwt

IT1187541749 commented 4 years ago

以下来源于新世纪五笔超大字符集. 参考:

\u9ea8  麨   swwt
\u9eb2  麲   swwq
\u4d2d  䴭   swwt
\u4d37  䴷   swwq
\U0002b1af  𫆯   egwt
\U00020345  𠍅   wswt
\U00023f0a  𣼊   iswt
\U00028123  𨄣   khdt
\U00028bbd  𨮽   qswt
\U00029354  𩍔   akft
\U0002a311  𪌑   swwt
\U0002a317  𪌗   swwt
\U0002a319  𪌙   swwy
\U0002a31d  𪌝   swwy
\U0002a328  𪌨   mnst
\U0002a32a  𪌪   swwi
\U0002a32b  𪌫   swwq
\U0002a32e  𪌮   swwt
\U0002a332  𪌲   eswt
\U0002a341  𪍁   swwt
\U0002a346  𪍆   swwt
\U0002a349  𪍉   swwt
\U0002a34b  𪍋   swwt
\U0002a353  𪍓   cnht
\U0002a358  𪍘   swwt
\U0002a360  𪍠   fpgt
\U0002a367  𪍧   ytnt
\U0002a36b  𪍫   cnht
\U0002a36c  𪍬   swwt
\U0002a36e  𪍮   swwt
\U0002a371  𪍱   fnwt
\U0002a37b  𪍻   kkkt
\U0002a37e  𪍾   bmyt
\U0002a381  𪎁   uegt
\U0002a383  𪎃   awnt
\U0002a387  𪎇   ogut
\U0002bb51  𫭑   lswt
\U0002bbd3  𫯓   swwq

下面这些含有"麥"这个部件的字也面临与"麦"同样的问题,所以应该修改为:

\u561c  嘜   kswq    kswt
\u9ea5  麥   swwq    swwt
\u4951  䥑   qswq    qswt
\u4a2b  䨫   fswq    fswt
\u4bae  䮮   cosq    cost
\u4d3b  䴻   tqtq    tqtt
\u4d45  䵅   gqtq    gqtt
\U0002b24d  𫉍   afwt    aswt
\U0002b77e  𫝾   rfwt    rswt
\U0002c5f4  𬗴   xfwt    xswt
\U0002ea4d  𮩍   wgvt    wyst

IT1187541749 commented 4 years ago

以下来源于新世纪五笔超大字符集.

下列五字编码是按港台字形来编码的,大陆字形是"巳",而港台字形是"⺋",因此下面五字应修改为:

\U00022556  𢕖   tsdb    tsdn
\U00022ccd  𢳍   rsdb    rsdn
\U0002361d  𣘝   ssdb    ssdn
\U00023edd  𣻝   isdb    isdn
\U00025c7a  𥱺   tsdb    tsdn

下面一字我认为应该上面是"十"下面是"子+八",属于上下结构,所以应该修改为:

\U00021947 𡥇 fbwi fbwu

参考:

\u2f91 ⾑ gmbk

下面的字应该拆为"一"+"冂"+"凵",所以下面的字应该修改为:

\u897e  襾   gmjg    gmbk
\U000212b9  𡊹   gmjf    gmbf
\U000277e0  𧟠   gmjg    gmbg
\U000277e3  𧟣   gmjw    gmbw
\U000277e4  𧟤   gmja    gmba
\U000277e8  𧟨   gmja    gmba
\U000277e9  𧟩   gmje    gmbe
\U000277f1  𧟱   gmjc    gmbc
\U000277f2  𧟲   gmjh    gmbh
\U000277f3  𧟳   gmje    gmbe
\U000277f4  𧟴   gmjq    gmbq
\U000277f9  𧟹   gmjf    gmbf
\U000277fb  𧟻   gmjf    gmbf
\U000277fc  𧟼   gmjf    gmbf
\U000277fd  𧟽   gmjx    gmbx
\U000277ff  𧟿   gmjf    gmbf
\U00027803  𧠃   gmjt    gmbt
\U00027804  𧠄   gmjb    gmbb
\U0002d5e5  𭗥   mgjb    mgmp
\U0002e5cb  𮗋   gmjj    gmbj

IT1187541749 commented 4 years ago

以下来源于新世纪五笔超大字符集.

参考:

\u6b63 正笔顺:12121

以下字符应修改为:

U+1D373 𝍳   ghi ghk
U+1D374 𝍴   ghi ghd

以下为未受影响的字符.

U+1D372 𝍲   ggll
U+1D375 𝍵   ghhk
U+1D376 𝍶   ghd

IT1187541749 commented 4 years ago

以下来源于新世纪五笔超大字符集.

参考:

\u60e1 惡 gfgn

以下字符应修改为:

\uf9b9 惡 gjgn gfgn

IT1187541749 commented 4 years ago

[：]：\⺕\丿丨\K\，\。\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\ 粛 vojk 笔顺:51124313432 肃 vijk 笔顺:51123234[⺕][丿丨]，[肃]丿，[丶]，[肃]，[，]，[，]，[，]，]，[丶]，[，]，[丶]，[，]，[丶]，[，]，[，]，[，]，]，]，]，]，]，\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\ 以下应修改为:
\u6bd0  毐   fxdf    fxdr
\u6bcb  毋   xdd xde
\u6bce  毎   txff    txfj
\u6bcc  毌   xfd xfk
\u2f4f  ⽏   xfd xfk
\U000233ed  𣏭   sxdf    sxdr
\U0002a788  𪞈   wxff    wxfj
\U00023aec  𣫬   xgjk    xak
[：]𠂇，\，𠂇戎\，\，\，\，\，\，\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\ 戎与毋都用到了𠂇这个字根,都不足四码,由于笔顺问题导致它们取的识别码不同,戎取的是𠂇这个字根中的丿,而毋取的是𠂇这个字根中的一. [，]，]，]，]，]丨，]，]，]，]，]，]，]，]，]，]，]，]，]，]，，，]，，，，，，，，，，，，，，，，，，，，，，，，，，，，，，，，，，，，，，，，，，，，，，，，，，，，，，，，，，，，，，，，，，，，，，，，，，，，，，，，，，，，，，，，字根相同笔顺不同的字还有肃与粛,它们的笔顺不同,但是取的识别码相同. 粛 vojk 笔顺:51124313432 [：⺕]丿丨[K]，]。 肃 vijk 笔顺:51123234 [⺕][丿丨]：⺕=丨丿丨丿丶==，\，\，肃\，丿\丶[J]，丿丨[丨，]，]，]，]，]，]，]，]，]，]，]，]，]，]，]，]，]，]，]，]，]，]，]，]，]，]，]，]，]，]，]，]，]，]，]，]，]，]，]，]，]，]，]，]，]，]，]，]，]，]，]，]，]，]，]，]，]，]，]，]，]，]，]，]，]，]，]，]，]，]，]，]，]，]，]，]，]，]丨]，]，]，]，]，]，]，]，]，]，]，]， GB18030-2000[，]，[，]，]，]，]，]，]，]，]，]，]，]，]，]，]，]，，，，，，，，，，，，，，\，\，\，\，\，\，\，\，\\\\\\\，\\\\，\，\，\，\，\，\\，\，\，\，\，\，\，\，\，\，\，\，\，\，\，\，\，\\，\，\，\，\，]，\，\，\，\\\\\\\\\\\，\，\，\，\，\\\\\\\，\，\，\，\，\，\\\\\\\，\\\，\，\，\，\\\\\\\\\\\ 因此我建议取末笔识别码应该取最后一个字根的末笔,而不是汉字笔顺的末笔,识别码取字根笔顺中的末笔我想所有人应该都能记住字根的笔顺,如果取汉字的笔顺中的末笔为识别码,近十万汉字又有多少人能记住笔顺?超大字符集中有些字非常奇怪,它的笔顺可能与你所想的完全不一样,同时相同类型的字笔顺也不一样. *：
\U00020991  𠦑   yaii
\U00026bc2  𦯂   ayai
\U0002769b  𧚛   yaie
\U000251b3  𥆳   yaih
\U00028055  𨁕   khyy    khyi
\U00021a1c  𡨜   pyay    pyai
\U0002348f  𣒏   syay    syai
\U000234d9  𣓙   suai    syao
取字根的末笔当识别码的好处就是不用知道当前所拆汉字笔顺,只需要知道它的字根笔顺就能取识别码,简单易记,同时字根的笔顺与大部汉字的笔顺是完全一样的,只有少量汉字的笔顺与字根笔顺不符,所以为了拆字更简单,取识别码应该取字根的末笔,而不是汉字笔顺的末笔. 取最后一个字根的末笔做识别码既符合大部分汉字的笔顺又能能兼容少部分汉字笔顺不正常的问题,可谓是一举多得呀. []，]，]，]， \， \，
识别码应该取"字根末笔"还是"笔顺末笔",建议再讨论,暂不修改。
新世纪五笔超大字符集依: 粛 vojk 笔顺:51124313432 拆分为字根:⺕+米+丿丨+识别码K 拆分与笔顺相同,无问题. 肃 vijk 笔顺:51123234 拆分为字根:⺕+小+丿丨+识别码K 拆分与笔顺不同,但是很直观,肃的最后两笔是丿与丶,肃取的是字根的末笔,由此可见不一定要完全按笔顺,如果完全按笔顺会造成相同类型的字拆分相互冲突. 以下应修改为:
\u6bd0  毐   fxdf    fxdr
\u6bcb  毋   xdd xde
\u6bce  毎   txff    txfj
\u6bcc  毌   xfd xfk
\u2f4f  ⽏   xfd xfk
\U000233ed  𣏭   sxdf    sxdr
\U0002a788  𪞈   wxff    wxfj
\U00023aec  𣫬   xgjk    xak
修改理由: 以上带𠂇这个字根的字虽然与戎字不相同,但是它们采用了同一个字根𠂇,在取识别码上应该采用同样的规则. 戎与毋都用到了𠂇这个字根,都不足四码,由于笔顺问题导致它们取的识别码不同,戎取的是𠂇这个字根中的丿,而毋取的是𠂇这个字根中的一. 带十这个字根的字同样也应该按字根的末笔取识别码,如华字,字根是十,先一后丨,参考:华 wxfj. 字根相同笔顺不同的字还有肃与粛,它们的笔顺不同,但是取的识别码相同. 粛 vojk 笔顺:51124313432 拆分为字根:⺕+米+丿丨+识别码K 拆分与笔顺相同,无问题. 肃 vijk 笔顺:51123234 拆分为字根:⺕+小+丿丨+识别码K 笔顺为:⺕+丨+丿丨+丿丶拆分与笔顺不同,但是很直观,肃的最后两笔是丿与丶,但是它取的识别码是J上的字根丿丨的末笔丨,杂合结构所以取K,由此可见取识别码不一定要完全按笔顺取汉字的末笔,如果完全按笔顺取末笔会造成相同类型的字拆分相互冲突. GB18030-2000字符集有27533个汉字,超大字符集更多,如果按笔顺取识别码的话近十万汉字,请问各位能记住多少汉字的笔顺?这么多汉字中有些相同类型的字因为笔顺问题导致这种相似的字取码不同,要想完全拆正确就得了解所有汉字的笔顺,我想没有人能记得住吧. 因此我建议取末笔识别码应该取最后一个字根的末笔,而不是汉字笔顺的末笔,识别码取字根笔顺中的末笔我想所有人应该都能记住字根的笔顺,如果取汉字的笔顺中的末笔为识别码,近十万汉字又有多少人能记住笔顺?超大字符集中有些字非常奇怪,它的笔顺可能与你所想的完全不一样,同时相同类型的字笔顺也不一样. 如下面的字:
\U00020991  𠦑   yaii
\U00026bc2  𦯂   ayai
\U0002769b  𧚛   yaie
\U000251b3  𥆳   yaih
\U00028055  𨁕   khyy    khyi
\U00021a1c  𡨜   pyay    pyai
\U0002348f  𣒏   syay    syai
\U000234d9  𣓙   suai    syao
取字根的末笔当识别码的好处就是不用知道当前所拆汉字笔顺,只需要知道它的字根笔顺就能取识别码,简单易记,同时字根的笔顺与大部汉字的笔顺是完全一样的,只有少量汉字的笔顺与字根笔顺不符,所以为了拆字更简单,取识别码应该取字根的末笔,而不是汉字笔顺的末笔. 取最后一个字根的末笔做识别码既符合大部分汉字的笔顺又能能兼容少部分汉字笔顺不正常的问题,可谓是一举多得呀. 重要的事情说三遍: 因此我建议取末笔识别码应该取最后一个字根的末笔,而不是汉字笔顺的末笔. 因此我建议取末笔识别码应该取最后一个字根的末笔,而不是汉字笔顺的末笔. 因此我建议取末笔识别码应该取最后一个字根的末笔,而不是汉字笔顺的末笔.
识别码应该取“字根末笔”还是“笔顺末笔”，建议再讨论，暂不修改。

补充两个字,一个GB18030-2000字集内的,另一个是超集中的.

修改理由同上.

\u3ce4  㳤   iuay    iyai
\U00027849  𧡉   hquu    hqyi

IT1187541749 commented 4 years ago

以下来源于新世纪五笔超大字符集.

参考:

\u5fe5  忥   rnnu
\u6c15  氕   rntr
\u6c16  氖   rnbr
\u6c18  氘   rnjj
\u6c19  氙   rnmj
\u6c1a  氚   rnkj
\u6c23  氣   rnou
\u6c25  氥   rnsf
\U00023c55  𣱕   rnvr
\U00023c56  𣱖   rnuf
\U00023c57  𣱗   rnge
\U00023c58  𣱘   rnvf
\U00023c59  𣱙   rnef
\U00023c5b  𣱛   rnou
\U00023c5f  𣱟   rnlf
\U00023c60  𣱠   rnuf
\U00027241  𧉁   rnju
\U0002f824  㔕   rnee

以下字应修改为:

\u6c17  気   rnri    rnru
\u6c1c  氜   rnjd    rnjf
\U0002c1cf  𬇏   rnsi    rnsu

beavailable commented 3 years ago

~~这里列出的错误会在 https://github.com/CNMan/rime-data 项目里更正吗？~~

~~我看到有些比如 “为”、“丑” 等还是错误的编码，能否更正一下呢？~~

抱歉，是我理解错了。

CNMan commented 2 years ago

以下来源于新世纪五笔超大字符集.

下列五字编码是按港台字形来编码的,大陆字形是"巳",而港台字形是"⺋",因此下面五字应修改为:
\U00022556    𢕖   tsdb    tsdn
\U00022ccd    𢳍   rsdb    rsdn
\U0002361d    𣘝   ssdb    ssdn
\U00023edd    𣻝   isdb    isdn
\U00025c7a    𥱺   tsdb    tsdn
下面一字我认为应该上面是"十"下面是"子+八",属于上下结构,所以应该修改为:

\U00021947 𡥇 fbwi fbwu

参考:

\u2f91 ⾑ gmbk

下面的字应该拆为"一"+"冂"+"凵",所以下面的字应该修改为:
\u897e    襾   gmjg    gmbk
\U000212b9    𡊹   gmjf    gmbf
\U000277e0    𧟠   gmjg    gmbg
\U000277e3    𧟣   gmjw    gmbw
\U000277e4    𧟤   gmja    gmba
\U000277e8    𧟨   gmja    gmba
\U000277e9    𧟩   gmje    gmbe
\U000277f1    𧟱   gmjc    gmbc
\U000277f2    𧟲   gmjh    gmbh
\U000277f3    𧟳   gmje    gmbe
\U000277f4    𧟴   gmjq    gmbq
\U000277f9    𧟹   gmjf    gmbf
\U000277fb    𧟻   gmjf    gmbf
\U000277fc    𧟼   gmjf    gmbf
\U000277fd    𧟽   gmjx    gmbx
\U000277ff    𧟿   gmjf    gmbf
\U00027803    𧠃   gmjt    gmbt
\U00027804    𧠄   gmjb    gmbb
\U0002d5e5    𭗥   mgjb    mgmp
\U0002e5cb    𮗋   gmjj    gmbj
U+2F91 ⾑按原版码表（U+897E 襾 gmjg）修正为gmjg，也符合Unicode CodeCharts中的字形。其他按你指出的修正。

CNMan commented 2 years ago

以下来源于新世纪五笔超大字符集. 参考:

\u9ea8    麨   swwt
\u9eb2    麲   swwq
\u4d2d    䴭   swwt
\u4d37    䴷   swwq
\U0002b1af    𫆯   egwt
\U00020345    𠍅   wswt
\U00023f0a    𣼊   iswt
\U00028123    𨄣   khdt
\U00028bbd    𨮽   qswt
\U00029354    𩍔   akft
\U0002a311    𪌑   swwt
\U0002a317    𪌗   swwt
\U0002a319    𪌙   swwy
\U0002a31d    𪌝   swwy
\U0002a328    𪌨   mnst
\U0002a32a    𪌪   swwi
\U0002a32b    𪌫   swwq
\U0002a32e    𪌮   swwt
\U0002a332    𪌲   eswt
\U0002a341    𪍁   swwt
\U0002a346    𪍆   swwt
\U0002a349    𪍉   swwt
\U0002a34b    𪍋   swwt
\U0002a353    𪍓   cnht
\U0002a358    𪍘   swwt
\U0002a360    𪍠   fpgt
\U0002a367    𪍧   ytnt
\U0002a36b    𪍫   cnht
\U0002a36c    𪍬   swwt
\U0002a36e    𪍮   swwt
\U0002a371    𪍱   fnwt
\U0002a37b    𪍻   kkkt
\U0002a37e    𪍾   bmyt
\U0002a381    𪎁   uegt
\U0002a383    𪎃   awnt
\U0002a387    𪎇   ogut
\U0002bb51    𫭑   lswt
\U0002bbd3    𫯓   swwq

下面这些含有"麥"这个部件的字也面临与"麦"同样的问题,所以应该修改为:

\u561c    嘜   kswq    kswt
\u9ea5    麥   swwq    swwt
\u4951    䥑   qswq    qswt
\u4a2b    䨫   fswq    fswt
\u4bae    䮮   cosq    cost
\u4d3b    䴻   tqtq    tqtt
\u4d45    䵅   gqtq    gqtt
\U0002b24d    𫉍   afwt    aswt
\U0002b77e    𫝾   rfwt    rswt
\U0002c5f4    𬗴   xfwt    xswt
\U0002ea4d    𮩍   wgvt    wyst

U+2B24D 𫉍、U+2B77E 𫝾、U+2C5F4 𬗴这三个暂按Unicode CodeCharts字形保留原编码。其他按你指出的修正。

CNMan commented 2 years ago

以下来源于新世纪五笔超大字符集. 参考:
\u9ea6    麦   gtu
\u9fcf    鿏   qgty
\u551b    唛   kgty
含有"麦"这个部件的字有很多是GT,而另一部分是GQ,有些从字形上看像"夕"另一些像"夂",还有一些像"处无卜",这样不利于学习,同时产生混淆,使人生不清应该是用GT还是GQ,所以应该统一一下,为什么不拆为GQ呢?因为有些字形是"处无卜",因为"夕"最后一点是出头的,与"夂"非常相似,你可以把"夕"当成"夂",但是你不能把"处无卜"当成"夕"来拆,所以全部统一修改为GT更好,(\U0002eb83 𮮃 gtci)这个字就是含有"处无卜"的字,因此以下含有"麦"这个部件的字应该修改为:
\u9eb8    麸   gqfw    gtfw
\u9eb9    麹   gqqo    gtqo
\u9eba    麺   gqdd    gtdd
\U0002ce4b    𬹋   gqjx    gtjx
\U0002ce4c    𬹌   gqwn    gtwn
\U0002ce4e    𬹎   gquk    gtuk
由上图可看出除了大陆字形是连在一起的之外港台都有分开的字形,同时是否相连除了放大细看之外不容易看清,为了利于拆分,应当把它当成"麦"来拆.

参考:

\U0002eb83 𮮃 gtci

所以以下两字应修改为:
\U0002b9ee    𫧮   dthi    gthi
\U0002c35e    𬍞   dtgy    gtgy
修改理由同上面两字一样,当成"王+夂"来拆,以下一字应该修改为:

\U0002a38d 𪎍 dthi gthi

参考:

\u7f91 羑 ugqy

以下字应该修改为:

\U000263c7 𦏇 uguy ugqy

以下是含有"麦"字未受影响的字:
\u9ea6    麦   gtu
\u9fcf    鿏   qgty
\u551b    唛   kgty
\U0002e2a2    𮊢   ugtu
\U0002eb87    𮮇   gtcg
\U0002eb86    𮮆   gtqn
\U0002eb85    𮮅   gtqw
\U0002eb84    𮮄   gtgn
\U0002eb83    𮮃   gtci
\U0002a31b    𪌛   gthn
\U0002a388    𪎈   gtay
\U0002a389    𪎉   gtmq
\U0002a38a    𪎊   gtit
\U0002a38b    𪎋   gthk
\U0002a38c    𪎌   gtgo
\U0002a38f    𪎏   gtpi
\U0002a390    𪎐   gtah
\U0002b711    𫜑   gtdh
\U0002b712    𫜒   gtpx
\U0002b713    𫜓   gtke
\U0002b714    𫜔   gtrf
\U0002ce45    𬹅   gtft
\U0002ce46    𬹆   gtaw
\U0002ce47    𬹇   gtfb
\U0002ce48    𬹈   gtie
\U0002ce49    𬹉   gtpq
\U0002ce4a    𬹊   gtaw
\U0002a165    𪅥   wyto
\U00026f06    𦼆   agty
\U000257c0    𥟀   tgty
\U00025aa3    𥪣   ucgt
\U00028310    𨌐   lgty
\U00028eae    𨺮   bcgt
\U00028e67    𨹧   bgty
\U00024ff2    𤿲   gthc
\U00026376    𦍶   ugtw
\U00020c8a    𠲊   kfty
\U0002ce4d    𬹍   gtad
\U0002da84    𭪄   sgty
\U0002dc17    𭰗   igty
\U0002de0c    𭸌   qtgt
\U0002e3c0    𮏀   agtu
\U0002e792    𮞒   gtpi
\U000249e1    𤧡   gfqb
\U00028afa    𨫺   qgtt
\U0002eb4f    𮭏   bgto
\U0002b715    𫜕   fpgt
\U0002e315    𮌕   mwwt

U+2CE4B 𬹋、U+2CE4C 𬹌、U+2CE4E 𬹎、U+2B9EE 𫧮、U+2C35E 𬍞、U+2A38D 𪎍这六个暂按Unicode CodeCharts字形保留原编码。其他按你指出的修正。

CNMan commented 2 years ago

以下来源于新世纪五笔超大字符集. 参考: 第一部分: 1. \U00020087 𠂇 dgt 笔顺 13
2.    \u5de6  左   daf 笔顺  13121
3.    \u53f3  右   dkf 笔顺  13251
4.    \u620e  戎   ade 笔顺  113534
5. \u6bcb 毋 xdd 笔顺 5531

总结1:上面都是用了"𠂇"这个字根的字,其中序号2-4字中的字根"𠂇"与序号1"𠂇"书写笔顺一致,笔顺是先"一"后"丿",同时它也是字根表中D上的字根"𠂇",而"毋"字中的字根"𠂇"的书写笔顺与键盘D上的字根"𠂇"不一致,是先"丿"后"一",由上面的字可以看出:"毋"字中的"𠂇"与字根"𠂇"笔顺不一致时不影响"毋"字使用字根"𠂇".

第二部分: 6. \u5341 十 fgh 笔顺 12
7.    \u4ec0  什   wfh 笔顺  3212
8.    \u6bd5  毕   xxfj    笔顺  153512
9.    \u771f  真   fhwu    笔顺  1225111134
10.   \u6bcc  毌   xfd 笔顺  5521
11.   \u8d2f  贯   xfmu    笔顺  55212534
12.   \u8cab  貫   xfmu    笔顺  55212511134
13.   \u60ef  惯   nxfm    笔顺  44255212534
14.   \u6163  慣   nxfm    笔顺  44255212511134
总结2:上面都是使用了"十"这个字根的字,其中序号7-9字中的字根"十"与序号6"十"的书写笔顺一致,笔顺是先"一"后"丨",同时它也是字根表中F上的字根"十",而序号10-14字中使用到的字根"十"在序号10-14字中的书写笔顺与字根表F上的字根"十"不一致,书写顺序是先"丿"后"一",由上面的字可以看出序号10-14字中的"𠂇"与字根表F上的字根"十"笔顺不一致时不影响10-14字使用字根"十".

参考:
\u529b    力   ent 笔顺  53
\u4ec2    仂   wet 笔顺  3253
由上面得出的结论得出的结果来看,以下字也不应该受到笔顺的影响,以下是需要修改的部分: 以下字应修改为:
\u4e3a    为   ytny    yeyi    笔顺  4354
\u4f2a    伪   wyty    wyey    笔顺  324354
\u59ab    妫   vyty    vyey
\u6ca9    沩   iyty    iyey
\u39d1    㧑   ryty    ryey
\U00020be0    𠯠   kyty    kyey
\U00027e51    𧹑   myty    myey
\U0002b1ed    𫇭   ayty    ayey
\U0002cb36    𬬶   qyty    qyey
以下字在官方码表中"为"字之所以不用"力"这个字根是因为"为"中的"力"与字根"力"笔顺不一致,所以在"为"字没有采用"力"这个字根. 修改理由:以上的字中都含有"为"这个部件,而"为"中的部件"力"与字根表E上的字根"力"在字形上完全一样,区别只是笔顺不同,"力"是先"𠃌"后"丿",而"为"字中的"力"是先"丿"后"𠃌",由上面的总结1与总结2中得出的结论来看"为"也不应该受到书写笔顺的影响才对,不能因为"为"字中的"力"与汉字"力"或者说字根"力"的笔顺不一样而不用"力"这个字根,因此以上含有"为"这个部件的字都应该修改.

以下字的修改理由同上: 修改理由:"丑"字中的左下部分与字根表F上的字根"土"从字形上来看一样,因此下面这些字也不应受笔顺影响而不用字根"土". 所以以下字应修改为:
\u4e11    丑   nhfd    nfd
\u541c    吜   knhf    knfg
\u599e    妞   vnhf    vnfg
\u5ff8    忸   nnhf    nnfg
\u626d    扭   rnhf    rnfg
\u677b    杻   snhf    snfg
\u6a7b    橻   snhf    snff
\u6c91    沑   inhf    infg
\u7084    炄   onhf    onfg
\u7c88    粈   onhf    onfg
\u7d10    紐   xnhf    xnfg
\u7ebd    纽   xnhf    xnfg
\u9215    鈕   qnhf    qnfg
\u94ae    钮   qnhf    qnfg
\u3eb2    㺲   gnhf    gnfg
\u43d4    䏔   enhf    enfg
\u45a1    䖡   jnhf    jnfg
\u46bc    䚼   ynhf    ynfg
\u46dd    䛝   ynhm    ynfm
\U000202a3    𠊣   wnhf    wnff
\U0002070b    𠜋   wnhj    wnfj
\U00020d3e    𠴾   knhf    knff
\U000211b4    𡆴   lnhf    lnfd
\U000216bd    𡚽   nhfv    nfvg
\U00021946    𡥆   nhfb    nfbg
\U00021e06    𡸆   mnhm    mnfm
\U00023174    𣅴   jnhf    jnfg
\U00023516    𣔖   snhf    snff
\U0002429b    𤊛   onhf    onff
\U00024684    𤚄   tnhf    tnff
\U00024de8    𤷨   unhf    unff
\U00024fe5    𤿥   qnhc    qnfc
\U00024fee    𤿮   knhc    knfc
\U00024fff    𤿿   nhfc    nfnc
\U00025128    𥄨   hnhf    hnfg
\U00025766    𥝦   tnhf    tnfg
\U000257f7    𥟷   tnhf    tnff
\U00025ba2    𥮢   tnhf    tnff
\U00025ea3    𥺣   onhf    onff
\U0002673b    𦜻   enhf    enff
\U00026c6a    𦱪   anhf    anff
\U00027a56    𧩖   ynhf    ynff
\U000282c0    𨋀   lnhf    lnfg
\U0002851a    𨔚   nhfp    nfnp
\U0002867a    𨙺   nhfb    nfbh
\U000286c4    𨛄   nnhb    nnfb
\U00028708    𨜈   nhfb    nfnb
\U00028709    𨜉   nhfb    nfvb
\U00028cde    𨳞   unhf    unfd
\U00028fca    𨿊   cnhy    cnfy
\U00029467    𩑧   nhfm    nfdm
\U0002a72b    𪜫   wnhf    wnfg
\U0002c6e2    𬛢   nhfh    nfah
以下一字是大字符集中我认为没有编错的字,如果你们不认同我的观点,那对于你们来说下面一字就是错误的.

\U00022ba2 𢮢 rnff

以下是含有丑字未受影响未修改过的字:
\u7f9e    羞   ugnf
\u4087    䂇   cnhf
\u4d8a    䶊   thlf
\U0002501e    𥀞   ugnc
\U00025373    𥍳   cnhf
\U0002635f    𦍟   hghf
\U0002636e    𦍮   hghf
\U0002a160    𪅠   ugno
\U0002b161    𫅡   ugnk
\U0002a634    𪘴   hbnf
\U00027fd4    𧿔   khnf
\U00028093    𨂓   khnf
\U0002690a    𦤊   thnf
U+22BA2 𢮢按原版码表（U+4E11 丑 nhfd）修正为rnhf。其他保留原编码。

CNMan commented 2 years ago

以下来源于新世纪五笔超大字符集. 参考:
\u9fb9    龹   udi 
\u5377    卷   udbb
\u5708    圈   ludb
\U23cfe   𣳾   udiu    
\U2c1e6   𬇦   udiu    
\u990b    餋   udwe
以下应修改为:
\U2d402   𭐂   ufwf    ewff
\U2eb4e   𮭎   ufwo    udjo
\U2b7e9   𫟩   ufwp    udnp
\U20509   𠔉   wfwu    udi
\U2da45   𭩅   eufi    eudi
\U2da43   𭩃   euft    eudt
\U2dc8c   𭲌   iufd    iudd
\U2dc71   𭱱   iufd    iudd
\U2daef   𭫯   sufi    sudi
\U2b764   𫝤   ufwd    udgd
\U2e368   𮍨   ufwe    udef
\U2e362   𮍢   ufwf    udgf
\U2d456   𭑖   ufwh    udyh
\U2ea1f   𮨟   ufwm    udxm
\U2d72e   𭜮   ufwn    udnu
\U2d44a   𭑊   ufwu    uduu
\U2d151   𭅑   ufwx    udxb
U+2E362 𮍢按你指出的修正。其他暂按Unicode CodeCharts字形保留原编码。

参考:
\u723b    爻   rru 
\U2cf06   𬼆   rru 
\u2f58    ⽘   rru 
可看做是两个X重叠. 以下应修改为: \U2bb63 𫭣 ruff rrff

可作为容错码。参考: \u57c0 埀 tfuf 以下应修改为: U+309D7 𰧗 dtgf dtff

已按你指出的修正。参考:
\u98df    食   wyve
\u2edd    ⻝   wyve
以下应修改为: \u2fb7 ⾷ wyvu wyve

已按你指出的修正。参考:
\u8671    虱   ntji
\u4eaa    亪   笔顺:4132345
下面一字修改理由为: 末笔为折而不是一捺,捺一般与其它笔划成对出现,类似繁体字中的八,而折一般单独出现.

\u4eaa 亪 yoyu yonb

按你指出的修正。

CNMan commented 2 years ago

\u3ce4 㳤 iuay iyai \U00027849 𧡉 hquu hqyi

按你指出的修正。