Closed initial-h closed 5 years ago
self.action_fc = tf.layers.dense(inputs=self.action_conv_flat, units=board_height * board_width, activation=tf.nn.log_softmax) 应该是softmax吧? 是为了后面好算吗?
这个关系不大的,只要后面用的时候知道输出的是log_act_probs,比如后面计算loss的时候需要log_act_probs就直接用,如果要计算act_probs的时候求个exp()即可。
self.action_fc = tf.layers.dense(inputs=self.action_conv_flat, units=board_height * board_width, activation=tf.nn.log_softmax) 应该是softmax吧? 是为了后面好算吗?