geektutu / blog

极客兔兔的博客,Coding Coding 创建有趣的开源项目。
https://geektutu.com
Apache License 2.0
167 stars 21 forks source link

TensorFlow 2.0 (七) - 强化学习 Q-Learning 玩转 OpenAI gym | 极客兔兔 #15

Open geektutu opened 5 years ago

geektutu commented 5 years ago

https://geektutu.com/post/tensorflow2-gym-q-learning.html

TensorFlow 2.0 入门系列文章,第七篇,Q-Learning 玩转 OpenAI gym game MountainCar-v0。

coach00 commented 4 years ago

tensorflow2.0好评

sunrimii commented 4 years ago

強化學習的這系列實在很有幫助 由淺入深 又配合新版tf

zsk2019 commented 4 years ago

训练模型,开始部分随机探索和利用的程序写反了导致前1/3训练没有用,调一下位置效果明显

geektutu commented 4 years ago

@zsk2019 可以更具体了么,比如贴出改动点?

zsk2019 commented 4 years ago

可以把这个和同名的原文件比较一下,这个一共训练5000次达到了和以前10000次相当的效果

在 2020-11-22 22:24:58,"Dai Jie" notifications@github.com 写道:

@zsk2019 可以更具体了么,比如贴出改动点?

— You are receiving this because you were mentioned. Reply to this email directly, view it on GitHub, or unsubscribe.

miaografa commented 3 years ago

最近在跟着兔兔学习,你的代码有些地方确实很优美啊!!赞! 写得也相当详细!支持!

miaografa commented 3 years ago

我尝试在前期指定初始位置开始模拟训练。通过在每轮训练开始,设置env.state,使得从山峰较高处开始训练,这样就能较快到达小旗子,从末尾开始Q-Tabel的迭代。

结果是得分更加稳定了,只是个有趣的观察。