Open yangshuodelove opened 2 years ago
在对应函数的开头,我们都放置了一个例子,你可以对照着看看。 https://github.com/fastnlp/TENER/blob/d2614d509dffb9b30636e3523a2f8f0dc4876708/modules/relative_transformer.py#L164 如果想弄清楚每一步在做什么的话,建议可以初始化一个例子的矩阵,并把bsz和head的维度都设置为1,然后打印每一步的输出,大概就能知道每一步的效果是怎样了。
请教relative_transformer.py中_transpose_shift函数中的几个问题: (1)它实现了矩阵的什么变换(如移动、旋转等)? (2)怎么理解它是如何实现这种变换的呢? (3)倒数第3行中的indice为什么只选取奇数行呢? (4)_transpose_shift函数与_shift有什么区别,又有什么联系? 十分感谢