Closed Jian787 closed 3 days ago
感谢。就是不知道能否给我修正的列表,比如:拉肚子 la1 du3 zi5 1144
-> 拉肚子 la1 du4 zi5 1144
,那么就直接给我:
拉肚子 la1 du4 zi5 1144
我后续把基础表修改为 8105 的时候,会把这部分映射上去
@Mintimate 好的,我现在就来做修正的列表发给你。不过我感觉这对基础表修改为 8105好像没什么作用啊,因为8105是单字词库,里面只有单字没有词组
@Mintimate 修正的列表做好了。你看一下 terra_rime_ice.base多音词校对和个别多音字校对列表.txt
一开始想校对所有多音字和多音词。但是把a、b、c开头的含多音字“子”的词校对完后,感觉工作量太大,于是就基本只校对了多音词。而且基本上只校对了词频>=100的词条。
对于“教授”jiao1 jiao4 这样除声调外拼音都相同的多音词,把原来的词频保留,并去掉多音词里声调不同的那个字的声调。(否则不加声调打字时,输入法只会取两种声调中词频更高的。)然后再按适当百分比分配两种声调。 如“教授”原本为:
教授 jiao4 shou4 32721
现在改为:
教授 jiao shou4 32721 教授 jiao1 shou4 9816 ( 9816 = 32721 0.3 ) 教授 jiao4 shou4 22904 ( 22904 = 32721 0.7 )
最后,为了试一试估计一下校对含多音字的词组工作量有多大,校对了含有多音字“重”zhong4 chong2 的词组。感觉改含多音字的词比改多音词麻烦多了。我还是等把单字8105改完了再来改base里面的多音字吧。