shiyybua / NER

基于tensorflow深度学习的中文的命名实体识别
1.05k stars 400 forks source link

遇到了一个问题,一直不知道怎么解决 #14

Open lele0401 opened 6 years ago

lele0401 commented 6 years ago

Traceback (most recent call last): File "rnn.py", line 153, in embedding = load_word2vec_embedding(vocab_size) File "/home/gmy/NER-master/utils.py", line 263, in load_word2vec_embedding embeddings[index] = cofes # 将词和对应的向量存到字典里 ValueError: could not broadcast input array from shape (0) into shape (300)

不知道怎么回事。 谢谢

hxh123 commented 6 years ago

你的word embedding 文件格式有问题,所以源码里split()不能分出一个单词和300个数字的array.

lele0401 commented 6 years ago

我的word embedding 是 txt格式的 和这个有关呢?谢谢~

hxh123 commented 6 years ago

和file的格式没关 是和file里面的内容的格式有关。。。

ChallengerL commented 6 years ago

我也遇到了这个问题,请问您解决了吗

Gemini77 commented 6 years ago

word embedding的格式有关,我刚开始用txt也有问题,后来直接用word2vec的save函数生成.vec格式的向量就解决了