Closed honey-mxy closed 4 months ago
作者您好!请问attention得到的权重(即通信策略)是由训练得来的,同时智能体本身的策略是由强化学习训练得来的,那么训练结束后保存的一个模型可以同时做到控制通讯策略和智能体本身的策略吗? 初学者,可能问题有些浅显,十分感谢您的回答!
通讯策略是智能体本身的策略的一部分
作者您好!请问attention得到的权重(即通信策略)是由训练得来的,同时智能体本身的策略是由强化学习训练得来的,那么训练结束后保存的一个模型可以同时做到控制通讯策略和智能体本身的策略吗? 初学者,可能问题有些浅显,十分感谢您的回答!