Open gmftbyGMFTBY opened 6 years ago
我的意思是,如果保留了是不是效果会更好呢?
人机对弈的时候还要考虑人一方的move,另外即使保留也只是两个move之后的子树,考虑到每一层的分支数量,两层之后的一个分支中的数据其实很少
谢谢
人机对弈的时候还要考虑人一方的move,另外即使保留也只是两个move之后的子树,考虑到每一层的分支数量,两层之后的一个分支中的数据其实很少
那在self_play的过程中为什么就要保存下来呢? 是因为self_play的过程中页是经过类似的搜索过程对整颗mcts树上的值有变动吗?
人机对弈的时候还要考虑人一方的move,另外即使保留也只是两个move之后的子树,考虑到每一层的分支数量,两层之后的一个分支中的数据其实很少
那在self_play的过程中为什么就要保存下来呢? 是因为self_play的过程中页是经过类似的搜索过程对整颗mcts树上的值有变动吗?
个人理解如果人机的话,只有一方搜索,相当于树更多的包含了对机器有利的分支,因为人很可能走对他有利的分支,这个分支很可能在树里面比较少探索的深度比较有限,所以保留下来意义也不大,数据太少。而如果self play 的时候,两个方向都有一定深度,所以适合共享
https://github.com/junxiaosong/AlphaZero_Gomoku/blob/66292c55cc53acfae7f7bc5a15a370571549bdd9/mcts_alphaZero.py#L206