opendilab / PPOxFamily

PPO x Family DRL Tutorial Course(决策智能入门级公开课:8节课帮你盘清算法理论,理顺代码逻辑,玩转决策AI应用实践 )
https://opendilab.github.io/PPOxFamily/
Apache License 2.0
2k stars 178 forks source link

Chapter6 Discussion #64

Open PaParaZz1 opened 1 year ago

PaParaZz1 commented 1 year ago

本 issue 将会追踪和记录各种有关课程第六讲的问题和延伸思考,欢迎有兴趣的同学在这个 issue 中评论,课程组会定期整理信息。 最新的 第六讲 QA 合集文档(2023.05.31更新)

yuechuhaoxi020609 commented 1 year ago

image 据我所知,这里可能是否是打错了呢? VDN在我印象中是个人值函数直接相加。

PaParaZz1 commented 1 year ago

image 据我所知,这里可能是否是打错了呢? VDN在我印象中是个人值函数直接相加。

确实是,这里应该是打错了,不是“相近”而是“相加”,我们会修改更新一下 PPT