关于网络更新时的问题

starry-sky6688 / MARL-Algorithms

Implementations of IQL, QMIX, VDN, COMA, QTRAN, MAVEN, CommNet, DyMA-CL, and G2ANet on SMAC, the decentralised micromanagement scenario of StarCraft II

1.42k stars 279 forks source link

关于网络更新时的问题 #80

Closed Duke-Allen closed 2 years ago

Duke-Allen commented 2 years ago

作者您好，我看到在coma.py的learn函数中用了torch.nn.utils.clip_grad_norm，但为什么在reinforce.py中没有用这个，而是在reinforce+g2anet的情况下才用？

starry-sky6688 commented 2 years ago

就是调个参，不同的算法在不同的参数下表现不同，你自己可以试一试

Duke-Allen commented 2 years ago

就是调个参，不同的算法在不同的参数下表现不同，你自己可以试一试

好的谢谢，顺便问一下，如果想要在PG的方法中加一下baseline应该怎么做？还有baseline应该怎么算您知道吗

starry-sky6688 commented 2 years ago

这个就不太清楚了，我挺久没写相关的代码了