gym模型中的action_sapce

PaddlePaddle / PARL

A high-performance distributed training framework for Reinforcement Learning

https://parl.readthedocs.io/

Apache License 2.0

3.22k stars 816 forks source link

Open Woodeeer opened 1 year ago

Woodeeer commented 1 year ago

在DDPG算法的仿真中将仿真模型修改为Humanoid-v3之后可以查询到此仿真模型的

print(env.action_space) 得到 Box(-0.4, 0.4, (17,), float32)

可以得知每个动作的范围是-0.4-0.4

我想请问一下这个动作范围是怎么设置的，现在我这边自己创建的仿真模型在mujoco210仿真窗口中看到的动作范围是-1-1 但是经过print(env.action_space)查询后得到的结果是0.0-0.0

rical730 commented 1 year ago

这个动作范围是gym设置的，和gym仿真环境使用相关的问题可以直接去gym的仓库提问哈。指路： https://github.com/openai/gym/issues

PS：我自己本地创建Humanoid-v3环境action_space是正常的，你可以再试试。

Woodeeer commented 1 year ago

嗯嗯好的谢谢您，我这边创建Humanoid-v3模型跟您的结果也是一样的，应该是我自己创建的模型的问题