Mintimate / oh-my-rime

The Simple Config Template Of Rime By Mintimate. QQ Chat-Group: 703260572
https://www.mintimate.cc
GNU General Public License v3.0
2.69k stars 182 forks source link

多音词校对和个别多音字校对 #155

Closed Jian787 closed 3 days ago

Jian787 commented 1 week ago

一开始想校对所有多音字和多音词。但是把a、b、c开头的含多音字“子”的词校对完后,感觉工作量太大,于是就基本只校对了多音词。而且基本上只校对了词频>=100的词条。

对于“教授”jiao1 jiao4 这样除声调外拼音都相同的多音词,把原来的词频保留,并去掉多音词里声调不同的那个字的声调。(否则不加声调打字时,输入法只会取两种声调中词频更高的。)然后再按适当百分比分配两种声调。 如“教授”原本为:

教授 jiao4 shou4 32721

现在改为:

教授 jiao shou4 32721 教授 jiao1 shou4 9816 ( 9816 = 32721 0.3 ) 教授 jiao4 shou4 22904 ( 22904 = 32721 0.7 )

最后,为了试一试估计一下校对含多音字的词组工作量有多大,校对了含有多音字“重”zhong4 chong2 的词组。感觉改含多音字的词比改多音词麻烦多了。我还是等把单字8105改完了再来改base里面的多音字吧。

Mintimate commented 1 week ago

感谢。就是不知道能否给我修正的列表,比如:拉肚子 la1 du3 zi5 1144 -> 拉肚子 la1 du4 zi5 1144,那么就直接给我:

拉肚子 la1 du4 zi5 1144

我后续把基础表修改为 8105 的时候,会把这部分映射上去

Jian787 commented 1 week ago

@Mintimate 好的,我现在就来做修正的列表发给你。不过我感觉这对基础表修改为 8105好像没什么作用啊,因为8105是单字词库,里面只有单字没有词组

Jian787 commented 1 week ago

@Mintimate 修正的列表做好了。你看一下 terra_rime_ice.base多音词校对和个别多音字校对列表.txt