starry-sky6688 / MARL-Algorithms

Implementations of IQL, QMIX, VDN, COMA, QTRAN, MAVEN, CommNet, DyMA-CL, and G2ANet on SMAC, the decentralised micromanagement scenario of StarCraft II
1.46k stars 283 forks source link

关于连续动作的问题 #74

Closed Kevinstone-199898 closed 2 years ago

Kevinstone-199898 commented 2 years ago

你好! 因为星际争霸环境的原因,所以这些算法里都是输出的离散动作。我想请问一下,如果我的环境是需要Agent采取连续动作的话,这些算法还能用吗? 十分感谢!

starry-sky6688 commented 2 years ago

不能用,大部分代码都是以DQN为基础结构的,G2ANet可以,但是你得改具体的代码,不能直接用;

你可以用MADDPG,能直接用在连续动作空间,这是我写的版本:https://github.com/starry-sky6688/MADDPG

Kevinstone-199898 commented 2 years ago

十分感谢!