TensorFlow 2.0 (七) - 强化学习 Q-Learning 玩转 OpenAI gym

geektutu / blog

极客兔兔的博客，Coding Coding 创建有趣的开源项目。

https://geektutu.com

Apache License 2.0

167 stars 21 forks source link

Open geektutu opened 5 years ago

geektutu commented 5 years ago

TensorFlow 2.0 入门系列文章，第七篇，Q-Learning 玩转 OpenAI gym game MountainCar-v0。

coach00 commented 4 years ago

tensorflow2.0好评

sunrimii commented 4 years ago

強化學習的這系列實在很有幫助由淺入深又配合新版tf

zsk2019 commented 4 years ago

训练模型，开始部分随机探索和利用的程序写反了导致前1/3训练没有用，调一下位置效果明显

geektutu commented 4 years ago

@zsk2019 可以更具体了么，比如贴出改动点？

zsk2019 commented 4 years ago

可以把这个和同名的原文件比较一下，这个一共训练5000次达到了和以前10000次相当的效果

在 2020-11-22 22:24:58，"Dai Jie" notifications@github.com 写道：

@zsk2019 可以更具体了么，比如贴出改动点？

— You are receiving this because you were mentioned. Reply to this email directly, view it on GitHub, or unsubscribe.

miaografa commented 3 years ago

最近在跟着兔兔学习，你的代码有些地方确实很优美啊！！赞！写得也相当详细！支持！

miaografa commented 3 years ago

我尝试在前期指定初始位置开始模拟训练。通过在每轮训练开始，设置env.state，使得从山峰较高处开始训练，这样就能较快到达小旗子，从末尾开始Q-Tabel的迭代。

结果是得分更加稳定了，只是个有趣的观察。