Open wangxin-fighting opened 1 month ago
您好,我有两个疑惑。 1:请问论文中图2的model overview里面,X和Xk-1两个有什么区别? 2:不同的transformer层是怎么连接的?比如我看您的代码里面只有encoder,没有decoder,请问第一层Transformer(encoder)的输出是什么,它是怎么传递到第二层作为输入的呢?
谢谢您的及时回复,祝您工作和学习顺遂。
您好,我有两个疑惑。 1:请问论文中图2的model overview里面,X和Xk-1两个有什么区别? 2:不同的transformer层是怎么连接的?比如我看您的代码里面只有encoder,没有decoder,请问第一层Transformer(encoder)的输出是什么,它是怎么传递到第二层作为输入的呢?