starry-sky6688 / MADDPG

Pytorch implementation of the MARL algorithm, MADDPG, which correspondings to the paper "Multi-Agent Actor-Critic for Mixed Cooperative-Competitive Environments".
516 stars 80 forks source link

关于对手策略的问题 #16

Closed Duke-Allen closed 2 years ago

Duke-Allen commented 2 years ago

作者您好,我看到代码中应该是只对我方智能体设定了MADDPG策略,对手似乎并没有设置策略,那请问这样的话,对手是随机走动吗?

starry-sky6688 commented 2 years ago

是的,对手策略是随机的

Duke-Allen commented 2 years ago

是的,对手策略是随机的

谢谢您的回答,还想再问一下,您知道这个环境下智能体动作是一个五维的向量,这5个都表示什么您清楚吗?我一直想知道但没看到有相关的解释

starry-sky6688 commented 2 years ago

貌似四个是每个方向的加速度,记不太清了,MPE环境里应该有说