Open Ivy-0321 opened 2 years ago
在您的 policy_gradient.py 文件中,请问 self.mu 需要乘多少是如何确定的呢?
动作值的范围,如果是-2~2就是*2,-1~1就什么都不用乘
您好,请问如果动作值是在一个正数范围应该怎么设置呢,比如进行价格预测,价格的上下区间都是正值,这个时候应该乘多少呢,或者需要更换成其他的激活函数吗?
请问self.sigma的值需要改变吗
在您的 policy_gradient.py 文件中,请问 self.mu 需要乘多少是如何确定的呢?