Closed MonaHe123 closed 1 month ago
作者您好,我想问一下,就是在您的critic网络定义的时候考虑的状态是所有agent的状态吗,但是我看MADDPG的伪代码,每个agent的Q网络考虑的自己的状态和所有的动作,我有点不太明白,麻烦您指导一下~
是的是的,因为x加了一个智能体的index,我理解错了,谢谢您!
或许你可以再仔细看看,x的上标是j,i才是智能体的index......
作者您好,我想问一下,就是在您的critic网络定义的时候考虑的状态是所有agent的状态吗,但是我看MADDPG的伪代码,每个agent的Q网络考虑的自己的状态和所有的动作,我有点不太明白,麻烦您指导一下~