junxiaosong / AlphaZero_Gomoku

An implementation of the AlphaZero algorithm for Gomoku (also called Gobang or Five in a Row)
MIT License
3.25k stars 965 forks source link

tensorflow 版本的网络action_fc的激活函数是log_softmax? #67

Closed initial-h closed 5 years ago

initial-h commented 5 years ago

self.action_fc = tf.layers.dense(inputs=self.action_conv_flat, units=board_height * board_width, activation=tf.nn.log_softmax) 应该是softmax吧? 是为了后面好算吗?

junxiaosong commented 5 years ago

这个关系不大的,只要后面用的时候知道输出的是log_act_probs,比如后面计算loss的时候需要log_act_probs就直接用,如果要计算act_probs的时候求个exp()即可。