关于词向量权重的初始化问题

yzhangcs / parser

:rocket: State-of-the-art parsers for natural language.

https://parser.yzhang.site/

MIT License

829 stars 141 forks source link

关于词向量权重的初始化问题 #13

Closed zjiehang closed 5 years ago

zjiehang commented 5 years ago

你好，观察到代码里将pretrained embedding和zero embedding进行了加和，请问这样的操作和不用zero embedding是不是做的一件事？由于zero embedding可以看作0均值0方差，在embedding dropout中在计算scale的时候将word level乘以2是否还有必要？谢谢。

yzhangcs commented 5 years ago

第二个embedding是trainable的，后面会进行学习