Closed jaried closed 2 years ago
MAT我们目前没有很多的使用经验,不过也许可以从以下几个角度考虑:
谢谢你们的回答。
请问,能否实现连续 MAT呢?
我们短期(1个月)内没有实现 MAT 相关算法的计划,不过也许你可以来在 DI-engine 里实现下?我们给你提供相应支持
我也想实现,但是估计1个月之内我还不能完全熟练使用DI-engine。
可以尝试下,我们会提供code review和在slack channel具体聊天讨论一些问题。你可以先从model部分开始,把这部分的神经网络搭起来。
我先跑通masac后,可以尝试一下。
请问,MARL,4个智能体,连续动作,每个智能体都能看到自己的状态和全局状态,资源有限,目标是合作收益最大化。
这样的情况下,什么算法比较好?MASAC、MAPPO、QMix、CollaQ?