young-how / DQN-based-UAV-3D_path_planer

RLGF is a general training framework suitable for UAV deep reinforcement learning tasks. And integrates multiple mainstream deep reinforcement learning algorithms(SAC, DQN, DDQN, PPO, Dueling DQN, DDPG).
MIT License
342 stars 39 forks source link

陷入局部最优解,徘徊 #22

Open lbboier opened 2 months ago

lbboier commented 2 months ago

我在某次迭代250次后,按照保存的参数,再训练就直接局部最优解了。一直在局部徘徊,删除Mod下的参数也没用,请问该如何解决

微信图片_20240930182852
young-how commented 1 month ago

采用的什么算法,可以看一下配置文件的参数是否有配置正确

lbboier commented 1 month ago

采用的什么算法,可以看一下配置文件的参数是否有配置正确 用的SAC算法,我修改地图为1000*1000 image

young-how commented 1 month ago

配置上看起来没什么问题,你可能需要单步调试一下看看sub_goals的路径是否为空,针对长距离的航线规划,会先将长路径拆解为多个中间路径点,如果sub_goals为空,说明拆解时发生了错误。