关于连续动作的问题

starry-sky6688 / MARL-Algorithms

Implementations of IQL, QMIX, VDN, COMA, QTRAN, MAVEN, CommNet, DyMA-CL, and G2ANet on SMAC, the decentralised micromanagement scenario of StarCraft II

1.47k stars 283 forks source link

关于连续动作的问题 #74

Closed Kevinstone-199898 closed 2 years ago

Kevinstone-199898 commented 2 years ago

你好！因为星际争霸环境的原因，所以这些算法里都是输出的离散动作。我想请问一下，如果我的环境是需要Agent采取连续动作的话，这些算法还能用吗？十分感谢！

starry-sky6688 commented 2 years ago

不能用，大部分代码都是以DQN为基础结构的，G2ANet可以，但是你得改具体的代码，不能直接用；

你可以用MADDPG，能直接用在连续动作空间，这是我写的版本：https://github.com/starry-sky6688/MADDPG

Kevinstone-199898 commented 2 years ago

十分感谢！