WU KONG checkpoint分享

XR-stb / DQN_WUKONG

基于DQN的黑神话悟空强化AI

56 stars 17 forks source link

WU KONG checkpoint分享 #2

Open zhanghang1995 opened 2 months ago

zhanghang1995 commented 2 months ago

开发者你好，请问有已经训练好的权重分享，支持本地推理吗

XR-stb commented 2 months ago

现在仓库里面就是我在用的参数，见judge.py，还在调整，所以这部分还有点凌乱. 目前打虎先锋感觉还不能收敛(打了40h了差不多)，还在逐步调整参数。

zhanghang1995 commented 2 months ago

好的，感谢啦。 1）请问是否方便提供一份训练40h的权重，供测试下，看看效果，方便的话，感谢您同步一份邮箱（zh749931552@gmail.com），也看看是否有新的更新路径？ 2）请问比如虎先锋场景训练的模型，是否能直接迁移至其他的boss场景，迁移是否需要重新制定奖励规则； 3）针对每一帧的图像信息读取，有考虑引入大模型的能力（或者对接API）？

XR-stb commented 2 months ago

已发到对应邮箱
可以直接迁移，奖励分你可以自己调整，现在的奖励分和模型收敛速度还不是很好。只能打打幽魂这种boss。不过restart.py 死亡自动走路到boss的逻辑你要自己调整
这样感觉会增加每帧处理的速度。如果不能再0.5内处理完一帧(现在每帧再用cudann加速的情况下也平均0.25s了)，AI就会变成高ping战士,只能挨打。

XR-stb commented 2 months ago

对了B站图灵的猫在做这一块的内容了，他视频里面说了做完后会公开这部分的代码。你也可以关注它后面的内容https://www.bilibili.com/video/BV1qE421c7mU/