feedliu / blog-comments

0 stars 0 forks source link

Q-learning 和 Double Q-learning — Feedliu's Blogs #17

Open feedliu opened 5 years ago

feedliu commented 5 years ago

https://feedliu.github.io/2019/04/01/qlearning-and-double-qlearning/

Q-learning是一种无模型的、异步策略、时间差分(TD)控制方法,关于无模型、异步策略、时间差分、预测和控制等概念,在先前的强化学习笔记中有详细描述。Double Q-learning是针对Q-learning的缺点提出的一种改进方法。