Record my paper reading about Machine Translation and other related works.
36
stars
2
forks
source link
19-EMNLP-The Bottom-up Evolution of Representations in the Transformer: A Study with Machine Translation and Language Modeling Objectives #22
Open
wangqiangneu opened 5 years ago
简介
分析在不同的任务中(LM, MLM, MT)中,token-level的表示在每层中是怎么变化的。度量的方法用了
mutual information
和canonical correlation analysis
。其中canonical correlation analysis
在这篇文章里也使用了,但是观测的是重要的神经元context encoding
,在最后两层的时候,开始token reconstruction
。观测的信号是,一个词在不同层的表示跟他的embedding的相关度(e.g. IM),发现是先减小再增大position
也很敏感论文信息
总结