Closed Yifeng-Lyu closed 4 years ago
麻烦您请教一下,在多agent 的情况下,最终目的是为了得到多个相同结构的网络?但是这要怎么训练呢,因为这并不是分布式数据平行只为了最终得到一个网络, 我的数据必须由两个进程各自提供,然后还有一个上层网络,上面网络的loss应该要会给各自两个网络,但是他们跨进程,不知道怎么能把梯度跨进程传递,其实就是Qmix下面带网络,网络结构一样但是位于不同的进程谢谢
当前版本使用了共享神经网络,最终确实是只有一个神经网络。
Agent跨进程进行集中式训练我也不太懂,十分抱歉~
不过我觉得,虽然你的数据必须由两个进程各自提供,但你可以把agent都放在一个进程里面,两个进程只不过各自把自己的数据传给对应的agent。如果不行的话我也没办法啦~
主要是环境决定了必须两个进程,每个一个agent才能正确取到各自的数据,没关系的,谢谢了
麻烦您请教一下,在多agent 的情况下,最终目的是为了得到多个相同结构的网络?但是这要怎么训练呢,因为这并不是分布式数据平行只为了最终得到一个网络, 我的数据必须由两个进程各自提供,然后还有一个上层网络,上面网络的loss应该要会给各自两个网络,但是他们跨进程,不知道怎么能把梯度跨进程传递,其实就是Qmix下面带网络,网络结构一样但是位于不同的进程谢谢