tinsir888 / tinsir888.github.io-gittalk

Open Comment for Personal Blog
GNU General Public License v3.0
0 stars 0 forks source link

动手强化学习 第七章 深度强化学习价值方法 | min hjemmeside #106

Open tinsir888 opened 6 months ago

tinsir888 commented 6 months ago

https://tinsir888.github.io/posts/c2c3d571.html

深度强化学习 价值和策略近似 是否可以通过深度神经网络直接近似价值/策略函数? 端到端强化学习 标准的 传统的 计算机视觉 需要 特征提取 中级特征提取 分类…… 而 AlexNet 的提出,深度学习的出现,使得 计算机视觉称为端到端的 相同的,深度强化学习使强化学习算法能够以端到端的方式解决复杂问题 深度强化学习 利用深度神经网络进行价值函数和策略近似 使得算法能够以端到端的方式解决复杂