dragen1860 / Deep-Learning-with-TensorFlow-book

深度学习入门开源书,基于TensorFlow 2.0案例实战。Open source Deep Learning book, based on TensorFlow 2.0 framework.
http://www.ai101edu.com
13.2k stars 4.09k forks source link

a3c代码注释小问题 #227

Open AInseven opened 3 years ago

AInseven commented 3 years ago

line170 # 从server拉取最新的梯度 self.client.set_weights(self.server.get_weights()) 拉取的应该时网络参数吧,不是梯度。给sever上传的是梯度,下载的不是梯度

感谢 老师每次函数都是换着用,学到很多,有心了

entropy = tf.nn.softmax_cross_entropy_with_logits(labels=policy, logits=logits) policy_loss = policy_loss - 0.01 * entropy

这段儿减去了的entropy 是 用logits 和 把softmax(logits)当labels 算的 自己和自己交叉熵,不过我试了下有用,就是作用不太明白,希望能补充解释下