Luka0612 / cw2vec

基于字符训练词向量
89 stars 30 forks source link

关于训练结果 #1

Closed Quorafind closed 6 years ago

Quorafind commented 6 years ago

请问训练结果现在表现如何?

Luka0612 commented 6 years ago

由于cw2vec涉及到对字符相似度的sum操作,训练起来比较久,而且还涉及一些超参数的调节,目前在训练&调节中,从中间输出的测试结果来过,效果还是可以期待下的

dalinvip commented 6 years ago

@Luka0612 请问,字符相似度的sum操作指的是什么?

Luka0612 commented 6 years ago

@bamtercelboo https://github.com/ShelsonCao/cw2vec/blob/master/cw2vec.pdf 在sim(w,c)中,作者是采用w的所有stroke与c进行对相似度,然后求和。你可以详细看下2.2 objective function

daqiang2 commented 5 years ago

你好我下载好训练模型后导入的时候出错,提示模型中的normalized_embeddings大小为(3786,128)