Open xwemin opened 4 years ago
计算pmi的时候,P('电影院')/(P('电')P('影')P('院')),为什么不是 P('电影院')/max(P('电影')P('院'),P('电')P('影院'))。后者的话可以不用最后处理首字和尾字的高频字符了
这是一个好主意, 感觉可以试一试
计算pmi的时候,P('电影院')/(P('电')P('影')P('院')),为什么不是 P('电影院')/max(P('电影')P('院'),P('电')P('影院'))。后者的话可以不用最后处理首字和尾字的高频字符了