starry-sky6688 / MARL-Algorithms

Implementations of IQL, QMIX, VDN, COMA, QTRAN, MAVEN, CommNet, DyMA-CL, and G2ANet on SMAC, the decentralised micromanagement scenario of StarCraft II
1.46k stars 283 forks source link

QMIX 目标网络更新 #88

Closed L-Spike closed 2 years ago

L-Spike commented 2 years ago

代码里qmix是每200次训练后将当前网络的参数全部复制到目标网络。 之前看到一些算法像DQN里的目标网络参数都是采用软更新,这样似乎稳定性更好。 所以想问一下qmix的目标网络更新可以采用软更新方式么?

starry-sky6688 commented 2 years ago

可以,用什么更新方式并不是固定的