动手强化学习第十四章多智能体强化学习

https://tinsir888.github.io/posts/8c0a0aa5.html

MARL 简介强化学习：智能体与环境交互，智能体感知环境结果，做出动作，得到环境反馈的奖励。环境要是稳态的：某些分布是确定不变的，否则不能保证强化学习的收敛性 MARL 的例子去中心化的游戏人工智能为复杂的集体游戏智能设计多智能体通信和协同学习的算法英雄联盟、星际争霸等城市交通车辆路由策略交通灯控制车队管理以及出租车调度分拣机器人 MARL 的难点原

tinsir888 / tinsir888.github.io-gittalk

动手强化学习第十四章多智能体强化学习 | min hjemmeside #101

tinsir888 / tinsir888.github.io-gittalk

动手强化学习 第十四章 多智能体强化学习 | min hjemmeside #101

动手强化学习第十四章多智能体强化学习 | min hjemmeside #101