starry-sky6688 / MARL-Algorithms

Implementations of IQL, QMIX, VDN, COMA, QTRAN, MAVEN, CommNet, DyMA-CL, and G2ANet on SMAC, the decentralised micromanagement scenario of StarCraft II
1.42k stars 279 forks source link

关于网络更新时的问题 #80

Closed Duke-Allen closed 2 years ago

Duke-Allen commented 2 years ago

作者您好,我看到在coma.pylearn函数中用了torch.nn.utils.clip_grad_norm,但为什么在reinforce.py中没有用这个,而是在reinforce+g2anet的情况下才用?

微信截图_20220228085908 微信截图_20220228090258
starry-sky6688 commented 2 years ago

就是调个参,不同的算法在不同的参数下表现不同,你自己可以试一试

Duke-Allen commented 2 years ago

就是调个参,不同的算法在不同的参数下表现不同,你自己可以试一试

好的谢谢,顺便问一下,如果想要在PG的方法中加一下baseline应该怎么做?还有baseline应该怎么算您知道吗

starry-sky6688 commented 2 years ago

这个就不太清楚了,我挺久没写相关的代码了