Open lxysl opened 3 years ago
“扬 姚”这个地方是个全角空格,用
values = l.split(' ')
进行切分就可以了。
请问你们用的是windows系统还是linux啊? 我用同样的代码加载的时候报错: embeddings_index[word] = np.asarray(values[1:], dtype='float32') TypeError: list indices must be integers or slices, not str
在使用以下代码加载搜狗新闻Word + Character + Ngram 300d,名为sgns.sogounews.bigram-char的文件时,发生错误:
错误为:
经过检查,我发现该文件某行的词向量是:
所以这个词应该是“扬 姚”吗?还是说“扬”和“姚”对应同一个词向量?
附:我按“扬”和“姚”对应同一个词向量进行解析的代码: