jsksxs360 / Word2Vec

对 ansj 编写的 Word2VEC_java 的进一步包装,同时实现了常用的词语相似度和句子相似度计算。
Apache License 2.0
176 stars 81 forks source link

例子都跑不通 #6

Open paomo30000 opened 6 years ago

paomo30000 commented 6 years ago

你的例子猫和狗的相似度是0.0 image

jsksxs360 commented 6 years ago

这也许是编码的问题,可能你把这个项目的编码设置为 UTF-8 就可以运行了。 code

paomo30000 commented 6 years ago

vec.loadGoogleModel("/Google_word2vec_zhwiki1710_300d.bin");这只是加载了模型,请问语料库怎么加载呢?还是不需要加载?我的意思是运行这个程序有没有前提条件?

jsksxs360 commented 6 years ago

加载好模型后就可以获取到模型中包含词语的词向量,从而计算相似度等操作。只是用户的部分词语可能没有被包含在使用通用语料训练出的默认模型中,所以可以用自己的语料训练模型,训练方法可以参见《训练 Google 版模型》