subaochen / subaochen.github.io

MIT License
1 stars 3 forks source link

DP学习笔记-使用值迭代解决赌徒问题 #53

Open subaochen opened 5 years ago

subaochen commented 5 years ago

https://subaochen.github.io/deeplearning/2019/06/21/gambler-problem/

brezezee commented 4 years ago

我在0.55时计算出来也是这个,但是如果对V进行随机初始化就不一样了

subaochen commented 4 years ago

我在0.55时计算出来也是这个,但是如果对V进行随机初始化就不一样了

谢谢告知!我抽空实验一下。