starry-sky6688 / MARL-Algorithms

Implementations of IQL, QMIX, VDN, COMA, QTRAN, MAVEN, CommNet, DyMA-CL, and G2ANet on SMAC, the decentralised micromanagement scenario of StarCraft II
1.46k stars 283 forks source link

关于训练得到的模型的问题 #116

Closed honey-mxy closed 4 months ago

honey-mxy commented 4 months ago

作者您好!请问attention得到的权重(即通信策略)是由训练得来的,同时智能体本身的策略是由强化学习训练得来的,那么训练结束后保存的一个模型可以同时做到控制通讯策略和智能体本身的策略吗? 初学者,可能问题有些浅显,十分感谢您的回答!

starry-sky6688 commented 4 months ago

通讯策略是智能体本身的策略的一部分