feedliu / blog-comments

0 stars 0 forks source link

【强化学习笔记5】无模型控制 — Feedliu #16

Open feedliu opened 5 years ago

feedliu commented 5 years ago

https://feedliu.github.io/2019/02/28/model-free-control/

上一章中我们讲到了无模型的预测(Model-Free Prediction),这一讲我们讲无模型的控制(Model-Free Control)。无模型的预测讲的是我们在不知道MDP环境信息的条件下如何评估一个策略,无模型的控制讲的是我们在不知道MDP环境信息的条件下如何优化一个策略。