Open wangqiangneu opened 5 years ago
对positional embedding的改进。原始的positional embedding(fixed)是由三角函数sin, cos根据不同位置产生的,是静态的,跟word content无关。然后这个PE再加上word embedding,作为self-attention。这个文章的思路是,把word embedding切成两部分,一部分还是表示word,另一部分用RNN(bi-dir or single-dir)进行位置表示
sin
cos
简介
对positional embedding的改进。原始的positional embedding(fixed)是由三角函数
sin
,cos
根据不同位置产生的,是静态的,跟word content无关。然后这个PE再加上word embedding,作为self-attention。这个文章的思路是,把word embedding切成两部分,一部分还是表示word,另一部分用RNN(bi-dir or single-dir)进行位置表示论文信息
总结