智能体决策不同时

starry-sky6688 / MARL-Algorithms

Implementations of IQL, QMIX, VDN, COMA, QTRAN, MAVEN, CommNet, DyMA-CL, and G2ANet on SMAC, the decentralised micromanagement scenario of StarCraft II

1.47k stars 283 forks source link

智能体决策不同时 #95

Closed Clown1206 closed 2 years ago

Clown1206 commented 2 years ago

您好，我最近在学习QMIX算法，遇到了一个问题想请教您，像VDN、QMIX这种多智能体强化学算法中，智能体的决策都是同时进行的吗，如果智能体的决策不同步，是不是就不能用这些算法来训练了。

starry-sky6688 commented 2 years ago

可以给环境加一个no_option的动作，然后在决策时把其他动作设置为非法动作，这样agent只能选择no_option，从而相当于没有决策