feedliu / blog-comments

0 stars 0 forks source link

【强化学习笔记4】无模型预测 — Feedliu #15

Open feedliu opened 5 years ago

feedliu commented 5 years ago

https://feedliu.github.io/2019/02/27/model-free-prediction/

上一张我们学习了如何应用动态规划解决强化学习问题,但是这是在MDP所有信息已知的情况下,如果不知道环境信息,我们该如何解决预测和控制问题呢?这章我们先来解决无环境信息的预测问题,称之为Model-Free Prediction。