动手强化学习第一章强化学习简介 | min hjemmeside

https://tinsir888.github.io/posts/a15fe612.html

授课老师：张伟楠 STJU 强化学习简介 Review：两种机器学习类型预测型根据数据预测所需输出（有监督）根据 P(x)P(x)P(x) 预测 P(y∣x)P(y|x)P(y∣x) 生成数据实例（无监督）：P(x,y)P(x,y)P(x,y) 决策型在动态环境中采取行动（强化学习），此处行动会引起环境中的改变转变到新的状态获得即时奖励随着时间的推移最大化累计奖

tinsir888 / tinsir888.github.io-gittalk

动手强化学习第一章强化学习简介 | min hjemmeside #166

tinsir888 / tinsir888.github.io-gittalk

动手强化学习 第一章 强化学习简介 | min hjemmeside #166

动手强化学习第一章强化学习简介 | min hjemmeside #166