Open qq1063642059 opened 3 years ago
那估计你得有一个比较好的电脑和GPU。 用深度强化学习,输入状态为游戏画面,输出动作为原神支持的键位组成的布尔向量。 奖励可以直接设置为完成比赛的时间,当然死亡或者超时时给予较大的惩罚并且直接结束当前情节。 然后跑上几天,估计有效果。
最有效率的方式请人工代打哈哈
那估计你得有一个比较好的电脑和GPU。 用深度强化学习,输入状态为游戏画面,输出动作为原神支持的键位组成的布尔向量。 奖励可以直接设置为完成比赛的时间,当然死亡或者超时时给予较大的惩罚并且直接结束当前情节。 然后跑上几天,估计有效果。
你这个不太现实,根本训练不上去啊,它会一直原地转圈根本完成不了一次比赛,而且根据带的圣遗物,角色,技能等级,不同敌人都要有不同打法,难道根据每个队伍每期深渊都要重训一次吗
动作空间太大了
人工智能,我的人工智能5555