Open daisuke85a opened 2 years ago
やるとしたらこれを参考にすると良さそう。
https://github.com/canberkakcali/gomoku-ai-minimax
minimax +アルファベータだからブラウザでも動かせそう
モンテカルロ木探索
https://qiita.com/toyohisa/items/e9f218909214c3a98ce2
モンテカルロ木探索は、最適解の可能性の高いところから基本的には探索する。よって、探索を途中でやめても、その段階における最適解になっているとみることができる。
AlphaZeroの記事
https://postd.cc/applied-data-sciencehow-to-build-your-own-alphazero-ai-using-python-and-keras/
スッキリわかるアルファゼロ ← めっちゃわかりやすい記事 https://horomary.hatenablog.com/entry/2021/06/21/000500
pythonでtic tac tieを実装した例
関係ないけど興味あるやつ
なんとブロック崩しのCPUがつくらるらしい
MuZero = 状態遷移モデル+AlphaZero
まずは
https://horomary.hatenablog.com/entry/2021/06/21/000500#3-UCT-モンテカルロ木探索
UCT-モンテカルロ木探索
で、CPUを作りたい。これがアルファゼロの理解にも繋がるから。 また、前回データとかも使わないから、データベースなしで作れる。フロントだけで作れるってこと。
これをtypescriptで実装したい
将来的に、アルファゼロを作りたくなった時、ニューラルネットワークのモデルはDynamoとかに置けばいいかも。
探索をフロントエンドにやらせることで、サーバー側の料金を抑える仕組み