PaddlePaddle / PARL

A high-performance distributed training framework for Reinforcement Learning
https://parl.readthedocs.io/
Apache License 2.0
3.22k stars 816 forks source link

gym模型中的action_sapce #965

Open Woodeeer opened 1 year ago

Woodeeer commented 1 year ago

在DDPG算法的仿真中将仿真模型修改为Humanoid-v3之后可以查询到此仿真模型的

print(env.action_space) 得到 Box(-0.4, 0.4, (17,), float32)

可以得知每个动作的范围是-0.4-0.4

我想请问一下这个动作范围是怎么设置的,现在我这边自己创建的仿真模型在mujoco210仿真窗口中看到的动作范围是-1-1 但是经过print(env.action_space)查询后得到的结果是0.0-0.0

rical730 commented 1 year ago

这个动作范围是gym设置的,和gym仿真环境使用相关的问题可以直接去gym的仓库提问哈。指路: https://github.com/openai/gym/issues

PS:我自己本地创建Humanoid-v3环境action_space是正常的,你可以再试试。 image

Woodeeer commented 1 year ago

嗯嗯好的谢谢您,我这边创建Humanoid-v3模型跟您的结果也是一样的,应该是我自己创建的模型的问题