mozillazg / phrase-pinyin-data

词语拼音数据
MIT License
437 stars 98 forks source link

存在很多的无理轻声 #33

Open Roseleaves opened 2 years ago

Roseleaves commented 2 years ago

乌拉莫名轻声 除此之外还有很多地方属于多音字的错用。不知道标音是人工识别还是AI自动识别的,但是如果使用Style.TONE3或TONE2把音调转化为各种a1/o3的形式,那么搜索"o "能比较有效率地找到更多轻声词的误用,以便改正。

kc-li commented 1 year ago

我也发现了过多的轻声,比如“朋友”的“友”字, “这个”的“个”字。 我发现现代汉语词典中这种无理轻声字比较少,所以我的解决方案是先加载large_pinyin,然后加载zdic_cibs覆盖部分large_pinyin中的一些data。 不过这样带来的一个问题是,overwrite文件中的数据是合并到large_pinyin当中的,有些纠正的字音可能会被zdic_cibs再度改写。所以我把手动修改的内容放到了di文件中(把它当成一个overwrite文件),最后加载di。

Pearlfish-H commented 1 year ago

我也发现了过多的轻声,比如“朋友”的“友”字, “这个”的“个”字。 我发现现代汉语词典中这种无理轻声字比较少,所以我的解决方案是先加载large_pinyin,然后加载zdic_cibs覆盖部分large_pinyin中的一些data。 不过这样带来的一个问题是,overwrite文件中的数据是合并到large_pinyin当中的,有些纠正的字音可能会被zdic_cibs再度改写。所以我把手动修改的内容放到了di文件中(把它当成一个overwrite文件),最后加载di。

「朋友」的「友」就是轻声,现代汉语词典如此。有些词不用轻声就难以分辨,比如「高粱」和「膏粱」。