Embedding / Chinese-Word-Vectors

100+ Chinese Word Vectors 上百种预训练中文词向量
Apache License 2.0
11.82k stars 2.32k forks source link

可否公开训练结果的词频文件? #72

Open feng-1985 opened 5 years ago

feng-1985 commented 5 years ago

可否公开训练结果的词频文件?

shenshen-hungry commented 5 years ago

词向量文件中的词是按词频排序的,可以通过Zipf's Law估算一下词频:)

feng-1985 commented 5 years ago

@shenshen-hungry 怎么知道频率最高的词频呢?

shenshen-hungry commented 5 years ago

最低词频是知道的。。。

manipulative commented 1 year ago

词向量文件中的词是按词频排序的,可以通过Zipf's Law估算一下词频:)

您好,请问基于这种方法估计出来的词频能用于TF-IDF或者SIF的计算吗?

@shenshen-hungry