linyiLYi / street-fighter-ai

This is an AI agent for Street Fighter II Champion Edition.
Apache License 2.0
6.34k stars 1.36k forks source link

请教GPT生成代码问题 #44

Open qfc123 opened 1 year ago

qfc123 commented 1 year ago

我尝试GPT生成了一个简单的21点游戏,有两个不同的目的1学会最佳策略 2 控制胜负平概率 目前感觉梯度下降有问题,但是没想清楚怎么改 https://note.youdao.com/s/FSCsYQJs

qfc123 commented 1 year ago

还尝试提问了其它一些方案,基本都卡在生成了可运行结果,但是不满足预期,然后GPT改不过来了,还得手动查资料找论文重构。

shenrui-li-ds commented 1 year ago

你可以先质疑你所编写的策略是否有问题,根据我粗略看过你的笔记,首先是固定的学习速率会导致梯度爆炸或者梯度消失,导致你的模型在有限的模拟次数内收敛(代表你的算法基本上是在随机瞎玩),你可以看看深度学习里面是怎么用adam optimizer来解决这个问题的,另外一个你的梯度下降函数中gamma变量也没有被调用过,不清楚应该起什么作用。还有一点是建议每次模拟后记录下场次数和该场次的损失函数得分,以此来观察你的模型是否有收敛趋势

qfc123 commented 1 year ago

你可以先质疑你所编写的策略是否有问题,根据我粗略看过你的笔记,首先是固定的学习速率会导致梯度爆炸或者梯度消失,导致你的模型在有限的模拟次数内收敛(代表你的算法基本上是在随机瞎玩),你可以看看深度学习里面是怎么用adam optimizer来解决这个问题的,另外一个你的梯度下降函数中gamma变量也没有被调用过,不清楚应该起什么作用。还有一点是建议每次模拟后记录下场次数和该场次的损失函数得分,以此来观察你的模型是否有收敛趋势

收到,谢谢,策略也是GPT提供的,笔记里所有的内容基本都是GPT的回复,在想怎么让GPT自己把错误的思路改掉,能拿来直接用。 非AI专业的程序缺少不少相关的基础知识,一些知识点看起来一脸懵,还在业余时间一点点啃