PPO中如何处理不同长度的episode？

MorvanZhou / Reinforcement-learning-with-tensorflow

Simple Reinforcement learning tutorials, 莫烦Python 中文AI教学

MIT License

8.92k stars 5.01k forks source link

Open YingxiaoKong opened 4 years ago

YingxiaoKong commented 4 years ago

莫凡你好，我想问一下，如果我的每个episode的长度不一样该怎么办呢？比如，我的每个episode都是以agent到达目的地结束，但是到达目的地的步数是不一样的。这种情况下该如何把他们变成一样的呢？