Open kinglai opened 8 years ago
看我新提的issue,希望能帮到你
必须uft-8格式
在 Word2VEC 类的 loadGoogleModel 方法最后把 wordMap.put(word, vectors); //dis.read(); 注释掉
操作系统是window7 64位,java 1.8 我是python导出的二进制文件,然后用loadGoogleModel 加载模型,word有问题,后来发现每次读完后都有dis.read(); 导致下一个词的字节少了1位,最后把dis.read(); 注释掉就好了
已解决 一是注释掉//dis.read(); 注释掉 二还需要new string指定“utf-8”
您好,您的邮件我已收到!
我用gensim训练的Word2Vec用这个程序加载时发现词的编码不对。请教一下是什么问题呢?