zhouhaoyi / Informer2020

The GitHub repository for the paper "Informer" accepted by AAAI 2021.
Apache License 2.0
5.27k stars 1.1k forks source link

周老师,关于s_layers为[3,2,1], 这样理解对吗? #573

Open xuhai1 opened 11 months ago

xuhai1 commented 11 months ago

s_layers配置[3,2,1]表示:

在第1层到第3层使用Sparse Self-attention机制,每层具有3个Self-attention头。 在第4层到第5层使用Sparse Self-attention机制,每层具有2个Self-attention头。 在第6层使用Sparse Self-attention机制,具有1个Self-attention头。

image