Closed zxin4506 closed 11 months ago
为什么第一个模块的命名为Local_MHRA或者说是Local MHRA Temporal,代码不是的Depthwise 3D Convolution吗?我的理解MHRA是MultiHeadResidualAttention的意思
MHRA的可以参考UniFormerV1,V2中沿用了V1的概念,Multi-Head Relation Aggregator
为什么第一个模块的命名为Local_MHRA或者说是Local MHRA Temporal,代码不是的Depthwise 3D Convolution吗?我的理解MHRA是MultiHeadResidualAttention的意思