Closed VaninaY closed 1 year ago
-项目地址:https://github.com/opendilab/PPOxFamily
类别:机器学习
项目标题:PPO × Family DRL Tutorial Course |决策智能入门级公开课:8 节课帮你盘清算法理论,理顺代码逻辑,玩转决策 AI 应用实践 )
项目描述:决策智能入门级公开课 PPO × Family 由中国计算机学会主办,上海人工智能实验室承办,全球高校人工智能学术联盟、北京大学人工智能研究院多智能体中心、浙江大学上海高等研究院、商汤科技协办,知乎、机器之心、智海平台、 Paperweekly 支持。顺利结课的学员可获得由中国计算机学会颁发的课程学习认证证书。
此课程旨在运用一种最经典的深度强化学习算法 Proximal Policy Optimization (PPO),解决各种各样的决策智能问题,帮助一切对于深度强化学习技术有好奇心的人,轻便且高效地制作应用原型,了解和学习最强大最易用的 PPO × Family。
课程项目总共分为 8节,每节课都有完整的视频材料,对算法原理进行深入讲解和分析,PPT 及代码 Notebook, 以及 2 - 3 份针对重难点进行扩展的补充材料。同时,课程项目组还配有多位助教老师在课程相关的群组中实时解答大家的问题,通过“ 讲演+实践+答疑 ”的形式,自底向上,从应用场景出发,打造全链路闭环的课程。
亮点:本系列课程将分为8节线上公开课,每节课40-50分钟。 相对于强化学习领域已有的优秀公开课,这门课并没有选择自顶向下地讲述强化学习发展演变的各个算法分支,而是自底向上地,从实际应用深度强化学习的角度出发,讲述把算法理论应用到实际决策问题时常用的种种分析方法和优化技巧,通过这门课让受众盘清算法理论,理顺代码逻辑,玩转决策AI应用实践。
其中,第 1 节课将会通过多重对比来讲解决策 AI 问题定义和研究的特殊之处;第 2 - 7 节课将会分别以子领域专题的形式,扩充 PPO × Family 的相关成员;最后一节课,将会综合运用之前累积的各方面知识,去设计和搭建一个“终极”智能体。
更重要的是,每节课程都会保持“算法理论-代码实现-应用实践”三合一的讲解模式,真正做到知其然(代码)又知其所以然(算法),并学以致用(应用)。
示例代码:https://github.com/opendilab/PPOxFamily/blob/main/chapter2_action/discrete_tutorial_zh.py
截图:
后续更新计划:第八节课将于 7 月上旬上线
项目地址:https://github.com/opendilab/PPOxFamily
PPO × Family DRL Tutorial Course | 决策智能入门级公开课
-项目地址:https://github.com/opendilab/PPOxFamily
类别:机器学习
项目标题:PPO × Family DRL Tutorial Course |决策智能入门级公开课:8 节课帮你盘清算法理论,理顺代码逻辑,玩转决策 AI 应用实践 )
项目描述:决策智能入门级公开课 PPO × Family 由中国计算机学会主办,上海人工智能实验室承办,全球高校人工智能学术联盟、北京大学人工智能研究院多智能体中心、浙江大学上海高等研究院、商汤科技协办,知乎、机器之心、智海平台、 Paperweekly 支持。顺利结课的学员可获得由中国计算机学会颁发的课程学习认证证书。
此课程旨在运用一种最经典的深度强化学习算法 Proximal Policy Optimization (PPO),解决各种各样的决策智能问题,帮助一切对于深度强化学习技术有好奇心的人,轻便且高效地制作应用原型,了解和学习最强大最易用的 PPO × Family。
课程项目总共分为 8节,每节课都有完整的视频材料,对算法原理进行深入讲解和分析,PPT 及代码 Notebook, 以及 2 - 3 份针对重难点进行扩展的补充材料。同时,课程项目组还配有多位助教老师在课程相关的群组中实时解答大家的问题,通过“ 讲演+实践+答疑 ”的形式,自底向上,从应用场景出发,打造全链路闭环的课程。
亮点:本系列课程将分为8节线上公开课,每节课40-50分钟。 相对于强化学习领域已有的优秀公开课,这门课并没有选择自顶向下地讲述强化学习发展演变的各个算法分支,而是自底向上地,从实际应用深度强化学习的角度出发,讲述把算法理论应用到实际决策问题时常用的种种分析方法和优化技巧,通过这门课让受众盘清算法理论,理顺代码逻辑,玩转决策AI应用实践。
其中,第 1 节课将会通过多重对比来讲解决策 AI 问题定义和研究的特殊之处;第 2 - 7 节课将会分别以子领域专题的形式,扩充 PPO × Family 的相关成员;最后一节课,将会综合运用之前累积的各方面知识,去设计和搭建一个“终极”智能体。
更重要的是,每节课程都会保持“算法理论-代码实现-应用实践”三合一的讲解模式,真正做到知其然(代码)又知其所以然(算法),并学以致用(应用)。
示例代码:https://github.com/opendilab/PPOxFamily/blob/main/chapter2_action/discrete_tutorial_zh.py
截图:
后续更新计划:第八节课将于 7 月上旬上线