opendilab / PPOxFamily

PPO x Family DRL Tutorial Course(决策智能入门级公开课:8节课帮你盘清算法理论,理顺代码逻辑,玩转决策AI应用实践 )
https://opendilab.github.io/PPOxFamily/
Apache License 2.0
1.89k stars 169 forks source link

Chapter4 Discussion #46

Open PaParaZz1 opened 1 year ago

PaParaZz1 commented 1 year ago

本 issue 将会追踪和记录各种有关课程第四讲的问题和思考,欢迎有兴趣的同学在这个 issue 中评论,课程组会定期整理信息。 最新的 第四讲 QA 合集文档(2023.05.24更新)

tuxiaobei-scu commented 1 year ago

image

如何实现Value Rescale的正向和逆向操作,以及如何运⽤到 PPO 算法中的代码完整⽰例搭配Link: https://opendilab.github.io/PPOxFamily/

好像完整实例没有呢(