Embedding / Chinese-Word-Vectors

100+ Chinese Word Vectors 上百种预训练中文词向量
Apache License 2.0
11.82k stars 2.32k forks source link

请问如何使用模型? #111

Open Ppaddington opened 4 years ago

Ppaddington commented 4 years ago

请问如何使用sgns.target.word-ngram.1-2.dynwin5.thr10.neg5.dim300.iter5这种文件呀? 这种iter5文件是什么东西? 自己看了一些回答还是一头雾水,可以提供如何使用模型的示例代码吗?谢谢!

yijun0612 commented 4 years ago

sgns.target.word-ngram.1-2.dynwin5.thr10.neg5.dim300.iter5按照打开txt文本的方式即可,例如: f = open('sgns.target.word-ngram.1-2.dynwin5.thr10.neg5.dim300.iter5','r',encoding='utf-8') for line in f: values = line.split() word = values[0] embeddings_index[word] = np.asarray(values[1:], dtype='float32') f.close() 具体解释可见问题#85:https://github.com/Embedding/Chinese-Word-Vectors/issues/85

Ppaddington commented 4 years ago

谢谢谢谢!------------------ 原始邮件 ------------------ 发件人: "yijun0612"<notifications@github.com> 发送时间: 2020年6月24日(星期三) 上午9:15 收件人: "Embedding/Chinese-Word-Vectors"<Chinese-Word-Vectors@noreply.github.com>; 抄送: "HuangXinhao"<3475635952@qq.com>;"Author"<author@noreply.github.com>; 主题: Re: [Embedding/Chinese-Word-Vectors] 请问如何使用模型? (#111)