starry-sky6688 / MARL-Algorithms

Implementations of IQL, QMIX, VDN, COMA, QTRAN, MAVEN, CommNet, DyMA-CL, and G2ANet on SMAC, the decentralised micromanagement scenario of StarCraft II
1.46k stars 283 forks source link

g2anet的hard attention无效 #62

Closed OLIVERisMZY closed 3 years ago

OLIVERisMZY commented 3 years ago

您好,我使用您的g2anet进行测试,训练几百盘后hard_out会输出全1。我在我自己的星际争霸2框架中也采用了您的方法进行hard attention,最后也输出全1。

image

这张图上我的actor网络每输出100次打印一下hard_weights[0][0]。 另外,我想在论文中引用一下您的框架,请问有什么引用格式可以参考一下呢,感谢

OLIVERisMZY commented 3 years ago

不知道是不是其论文的问题,因为他自己也没做过hard attention的消融,也有可能是代码的问题。

starry-sky6688 commented 3 years ago

全为1很容易理解,因为Hard Attention是为了过滤掉不重要信息的,而SMAC场景中每个agent的信息都比较重要,所以agent就会慢慢把所有的信息都考虑进来,不像论文中交通路口那个环境,有很多agent的信息是不重要的

引用的话,直接把这个项目的链接写成一个脚注放在下面就可以了~