XR-stb / DQN_WUKONG

基于DQN的黑神话悟空强化AI
56 stars 17 forks source link

WU KONG checkpoint分享 #2

Open zhanghang1995 opened 2 months ago

zhanghang1995 commented 2 months ago

开发者你好,请问有已经训练好的权重分享,支持本地推理吗

XR-stb commented 2 months ago

现在仓库里面就是我在用的参数,见judge.py,还在调整,所以这部分还有点凌乱. 目前打虎先锋感觉还不能收敛(打了40h了差不多),还在逐步调整参数。

zhanghang1995 commented 2 months ago

好的,感谢啦。 1)请问是否方便提供一份训练40h的权重,供测试下,看看效果,方便的话,感谢您同步一份邮箱(zh749931552@gmail.com),也看看是否有新的更新路径? 2)请问比如虎先锋场景训练的模型,是否能直接迁移至其他的boss场景,迁移是否需要重新制定奖励规则; 3)针对每一帧的图像信息读取,有考虑引入大模型的能力(或者对接API)?

XR-stb commented 2 months ago
  1. 已发到对应邮箱
  2. 可以直接迁移,奖励分你可以自己调整,现在的奖励分和模型收敛速度还不是很好。只能打打幽魂这种boss。 不过restart.py 死亡自动走路到boss的逻辑你要自己调整
  3. 这样感觉会增加每帧处理的速度。如果不能再0.5内处理完一帧(现在每帧再用cudann加速的情况下也平均0.25s了),AI就会变成高ping战士,只能挨打。
XR-stb commented 2 months ago

对了B站图灵的猫在做这一块的内容了,他视频里面说了做完后会公开这部分的代码。你也可以关注它后面的内容https://www.bilibili.com/video/BV1qE421c7mU/