状态空间42 - Githubissues

young-how / DQN-based-UAV-3D_path_planer

RLGF is a general training framework suitable for UAV deep reinforcement learning tasks. And integrates multiple mainstream deep reinforcement learning algorithms(SAC, DQN, DDQN, PPO, Dueling DQN, DDPG).

MIT License

342 stars 39 forks source link

状态空间42 #17

Open fwhp325 opened 9 months ago

fwhp325 commented 9 months ago

你好我想修改无人机行走途中的影像因素，在我增加因素之后，状态空间的个数不对，请问状态空间的个数是怎么计算的

young-how commented 9 months ago

参见uav.state()，自定义的状态空间需要同步更改神经网络参数等设置

fwhp325 commented 9 months ago

你好，关于状态空间个数我的想法是16个无人机状态参数加上3x3x3的27个地图参数应该是43个但是你设置为42，同步修改神经网络我的理解是打开权重文件来修改，但是打不开，请问具体的修改方法是什么？麻烦作者有空的解答一下，谢谢，祝一切顺利

young-how commented 9 months ago

权重文件是根据原有状态空间设置训练得到的，自定义状态空间后需要重新训练收敛得到新的权重文件

xdlbw commented 8 months ago

我也想问状态空间的维度为什么是42

xdlbw commented 8 months ago

我也想问状态空间的维度为什么是42

我清楚了，因为排除了当前无人机所在点，即当各方向增量ijk均为0时的情况，这种情况下不需要添加状态参数，所以总的状态空间维度为16+3^3-1=42