Open geektutu opened 5 years ago
tensorflow2.0好评
強化學習的這系列實在很有幫助 由淺入深 又配合新版tf
训练模型,开始部分随机探索和利用的程序写反了导致前1/3训练没有用,调一下位置效果明显
@zsk2019 可以更具体了么,比如贴出改动点?
可以把这个和同名的原文件比较一下,这个一共训练5000次达到了和以前10000次相当的效果
在 2020-11-22 22:24:58,"Dai Jie" notifications@github.com 写道:
@zsk2019 可以更具体了么,比如贴出改动点?
— You are receiving this because you were mentioned. Reply to this email directly, view it on GitHub, or unsubscribe.
最近在跟着兔兔学习,你的代码有些地方确实很优美啊!!赞! 写得也相当详细!支持!
我尝试在前期指定初始位置开始模拟训练。通过在每轮训练开始,设置env.state,使得从山峰较高处开始训练,这样就能较快到达小旗子,从末尾开始Q-Tabel的迭代。
结果是得分更加稳定了,只是个有趣的观察。
https://geektutu.com/post/tensorflow2-gym-q-learning.html
TensorFlow 2.0 入门系列文章,第七篇,Q-Learning 玩转 OpenAI gym game MountainCar-v0。