NLPchina / Word2VEC_java

word2vec java版本的一个实现
693 stars 486 forks source link

加载loadGoogleModel后的单词编码不对,不知是什么问题。 #22

Open kinglai opened 8 years ago

kinglai commented 8 years ago

我用gensim训练的Word2Vec用这个程序加载时发现词的编码不对。请教一下是什么问题呢?

xuexingdong commented 8 years ago

看我新提的issue,希望能帮到你

ansjsun commented 7 years ago

必须uft-8格式

ansjsun commented 7 years ago

23

swy0915 commented 6 years ago

在 Word2VEC 类的 loadGoogleModel 方法最后把 wordMap.put(word, vectors); //dis.read(); 注释掉

操作系统是window7 64位,java 1.8 我是python导出的二进制文件,然后用loadGoogleModel 加载模型,word有问题,后来发现每次读完后都有dis.read(); 导致下一个词的字节少了1位,最后把dis.read(); 注释掉就好了

Arthassssss commented 2 years ago

已解决 一是注释掉//dis.read(); 注释掉 二还需要new string指定“utf-8”

dongliuliu commented 2 years ago

    您好,您的邮件我已收到!