MorvanZhou / Reinforcement-learning-with-tensorflow

Simple Reinforcement learning tutorials, 莫烦Python 中文AI教学
https://mofanpy.com/tutorials/machine-learning/reinforcement-learning/
MIT License
8.92k stars 5.01k forks source link

PPO中如何处理不同长度的episode? #166

Open YingxiaoKong opened 4 years ago

YingxiaoKong commented 4 years ago

莫凡你好, 我想问一下,如果我的每个episode的长度不一样该怎么办呢? 比如,我的每个episode都是以agent到达目的地结束,但是到达目的地的步数是不一样的。这种情况下该如何把他们变成一样的呢?