Closed PeifengRen closed 3 years ago
您好请问在增强学习过程中,策略网络中的θ参数是如何更新的,我在代码中没有找到,这个地方有点疑惑,谢谢~
策略网络的参数更新在这里,meta的参数更新在这里。
谢谢!
您好请问在增强学习过程中,策略网络中的θ参数是如何更新的,我在代码中没有找到,这个地方有点疑惑,谢谢~