gaussic / text-classification-cnn-rnn

CNN-RNN中文文本分类,基于TensorFlow
MIT License
4.16k stars 1.47k forks source link

embeding使用的是随机向量,可否用word2vec预先训练好的字向量作为embedding模型效果更好一些,请教一下作者为什么要用随机生成的字向量呢? #141

Closed Paulliuliu closed 4 years ago

Paulliuliu commented 4 years ago

embeding使用的是随机向量,可否用word2vec预先训练好的字向量作为embedding模型效果更好一些,请教一下作者为什么要用随机生成的字向量呢?

gaussic commented 4 years ago

不是所有的模型,一开始就一定要导入1个训练好的词向量的。 完全可以从一个随机的向量开始,去训练一个符合特定任务的词向量。 要掌握两个概念,随机训练(training with random initialization) 和 微调(fine-tuning)。

建议初学者不要一上来就是word2vec,先掌握神经网络的基本概念。

Paulliuliu commented 4 years ago

非常感谢