Bigpig4396 / PyTorch-Soft-Actor-Critic-SAC

1 stars 1 forks source link

怎么选择多智能体的动作呀 #1

Open chatsmile opened 8 months ago

chatsmile commented 8 months ago

group_list = [action, 2],这个应该是随便设置的吧qaq 我复制上面的action粘贴了一个action2 设置了一个action1,一个action2,请问这样可以吗? 感觉很难收敛欸qaq

Bigpig4396 commented 8 months ago

2可以改成其他的数字如0-3,全程保持不变即可。这个环境是Multi agent改的,第二个参数在这里没有用。很难收敛应该是环境的问题,这个环境是sparse reward,很难采集到有效的经验。算法应该没啥大问题。

chatsmile commented 8 months ago

啊?我以为第二个参数是第二个智能体的动作选择呢qaq,那如果是三个智能体,就改成[action,2,2]这样吗

发自我的iPhone

------------------ 原始邮件 ------------------ 发件人: Shuo Jiang @.> 发送时间: 2023年12月18日 17:12 收件人: Bigpig4396/PyTorch-Soft-Actor-Critic-SAC @.> 抄送: rexinwangyouxy @.>, Author @.> 主题: Re: [Bigpig4396/PyTorch-Soft-Actor-Critic-SAC] 怎么选择多智能体的动作呀 (Issue #1)

2可以改成其他的数字如0-3,全程保持不变即可。这个环境是Multi agent改的,第二个参数在这里没有用。很难收敛应该是环境的问题,这个环境是sparse reward,很难采集到有效的经验。算法应该没啥大问题。

— Reply to this email directly, view it on GitHub, or unsubscribe. You are receiving this because you authored the thread.Message ID: @.***>

Bigpig4396 commented 8 months ago

这个环境写的时候就是两个智能体,这个算法是单智能体算法,所以我就给第二个智能体一个固定的动作,它就永远走不到终点,得不到奖励,相当于第二个智能体不存在。算法输出的动作只作用在第一个智能体上。如果要加智能体数量的话需要把环境改一下。