Open tinsir888 opened 5 months ago
https://tinsir888.github.io/posts/8c0a0aa5.html
MARL 简介 强化学习:智能体与环境交互,智能体感知环境结果,做出动作,得到环境反馈的奖励。 环境要是稳态的:某些分布是确定不变的,否则不能保证强化学习的收敛性 MARL 的例子 去中心化的游戏人工智能 为复杂的集体游戏智能设计多智能体通信和协同学习的算法 英雄联盟、星际争霸等 城市交通 车辆路由策略 交通灯控制 车队管理以及出租车调度 分拣机器人 MARL 的难点 原
https://tinsir888.github.io/posts/8c0a0aa5.html
MARL 简介 强化学习:智能体与环境交互,智能体感知环境结果,做出动作,得到环境反馈的奖励。 环境要是稳态的:某些分布是确定不变的,否则不能保证强化学习的收敛性 MARL 的例子 去中心化的游戏人工智能 为复杂的集体游戏智能设计多智能体通信和协同学习的算法 英雄联盟、星际争霸等 城市交通 车辆路由策略 交通灯控制 车队管理以及出租车调度 分拣机器人 MARL 的难点 原