Closed smilelc3 closed 5 years ago
请问能否提供下不删除生僻字和低频字的数据呢?我们想统计下非一级字频的比例
你好,萌名的词频数据,不会公开。
不过,observerss的“根据姓名来判断性别”里有一份词频表,你可以去看看:https://github.com/observerss/ngender/blob/master/ngender/charfreq.csv 。
请问能否提供下不删除生僻字和低频字的数据呢?我们想统计下非一级字频的比例