Open feedliu opened 5 years ago
https://feedliu.github.io/2019/02/28/model-free-control/
上一章中我们讲到了无模型的预测(Model-Free Prediction),这一讲我们讲无模型的控制(Model-Free Control)。无模型的预测讲的是我们在不知道MDP环境信息的条件下如何评估一个策略,无模型的控制讲的是我们在不知道MDP环境信息的条件下如何优化一个策略。
https://feedliu.github.io/2019/02/28/model-free-control/
上一章中我们讲到了无模型的预测(Model-Free Prediction),这一讲我们讲无模型的控制(Model-Free Control)。无模型的预测讲的是我们在不知道MDP环境信息的条件下如何评估一个策略,无模型的控制讲的是我们在不知道MDP环境信息的条件下如何优化一个策略。