Open Melanielyw opened 5 years ago
您好,我想请问如果待预测的文本中出现词向量表中没有的单词,是怎样表示的呢?谢谢您!
只有那些在词汇表中的词才会被选中去训练,如果一个词没有出现的话,他是不会被编进去的。比如:这是一个奇葩的例子。因为奇葩这个词在词汇表中没有,那么真正编码的句子是:这是一个例子。你可以仔细看一下loader.py中的这句话: data_id.append([word_to_id[x] for x in contents[i] if x in word_to_id])
您好,我想请问如果待预测的文本中出现词向量表中没有的单词,是怎样表示的呢?谢谢您!