sanoyo / all-paper-deep-learning-machine-lerning

0 stars 0 forks source link

Bayesian Optimization in AlphaGo #27

Open sanoyo opened 5 years ago

sanoyo commented 5 years ago

要約

AlphaGoで使用された、ハイパーパラメータを調節するための手法ベイズ最適化をどのように使用したかが説明されている。

Alphagoは主に2つのことを行っており、MCTSのチューニングを行った。

  1. ニューラルネットワークでトレーニング
  2. モンテカルロ木探索(MCTS)を使ってのゲーム実行

論文リンク

https://arxiv.org/pdf/1812.06855.pdf

ベイズ最適化について

https://www.slideshare.net/hoxo_m/ss-77421091 https://qiita.com/masasora/items/cc2f10cb79f8c0a6bbaa

モンテカルロ木探索(MCTS)について

http://ibisml.org/archive/ibis2014/ibis2014yoshizoe.pdf