starry-sky6688 / MARL-Algorithms

Implementations of IQL, QMIX, VDN, COMA, QTRAN, MAVEN, CommNet, DyMA-CL, and G2ANet on SMAC, the decentralised micromanagement scenario of StarCraft II
1.47k stars 283 forks source link

智能体决策不同时 #95

Closed Clown1206 closed 2 years ago

Clown1206 commented 2 years ago

您好,我最近在学习QMIX算法,遇到了一个问题想请教您,像VDN、QMIX这种多智能体强化学算法中,智能体的决策都是同时进行的吗,如果智能体的决策不同步,是不是就不能用这些算法来训练了。

starry-sky6688 commented 2 years ago

可以给环境加一个no_option的动作,然后在决策时把其他动作设置为非法动作,这样agent只能选择no_option,从而相当于没有决策