Closed honey-mxy closed 3 months ago
作者您好!请问在g2anet中,为什么将这里的weights是action的weights,即图中这里,我理解的是hard attention和soft attention融合后的attention,十分感谢作者的回答!
这个是agent在决策的时候输出的各个动作的权重,后续要根据 这个权重来为每个动作计算被采样的概率,再采样出一个动作来执行;hard attention和soft attention是模型内部的计算,这个已经是在模型外面了
作者您好!请问在g2anet中,为什么将这里的weights是action的weights,即图中这里,我理解的是hard attention和soft attention融合后的attention,十分感谢作者的回答!