怎么选择多智能体的动作呀

chatsmile commented 8 months ago

group_list = [action, 2]，这个应该是随便设置的吧qaq 我复制上面的action粘贴了一个action2 设置了一个action1，一个action2，请问这样可以吗？感觉很难收敛欸qaq

Bigpig4396 commented 8 months ago

2可以改成其他的数字如0-3，全程保持不变即可。这个环境是Multi agent改的，第二个参数在这里没有用。很难收敛应该是环境的问题，这个环境是sparse reward，很难采集到有效的经验。算法应该没啥大问题。

chatsmile commented 8 months ago

啊？我以为第二个参数是第二个智能体的动作选择呢qaq，那如果是三个智能体，就改成[action,2,2]这样吗

发自我的iPhone

------------------ 原始邮件 ------------------ 发件人: Shuo Jiang @.> 发送时间: 2023年12月18日 17:12 收件人: Bigpig4396/PyTorch-Soft-Actor-Critic-SAC @.> 抄送: rexinwangyouxy @.>, Author @.> 主题: Re: [Bigpig4396/PyTorch-Soft-Actor-Critic-SAC] 怎么选择多智能体的动作呀 (Issue #1)

2可以改成其他的数字如0-3，全程保持不变即可。这个环境是Multi agent改的，第二个参数在这里没有用。很难收敛应该是环境的问题，这个环境是sparse reward，很难采集到有效的经验。算法应该没啥大问题。

— Reply to this email directly, view it on GitHub, or unsubscribe. You are receiving this because you authored the thread.Message ID: @.***>

Bigpig4396 commented 8 months ago

这个环境写的时候就是两个智能体，这个算法是单智能体算法，所以我就给第二个智能体一个固定的动作，它就永远走不到终点，得不到奖励，相当于第二个智能体不存在。算法输出的动作只作用在第一个智能体上。如果要加智能体数量的话需要把环境改一下。

Bigpig4396 / PyTorch-Soft-Actor-Critic-SAC

怎么选择多智能体的动作呀 #1