junxiaosong / AlphaZero_Gomoku

An implementation of the AlphaZero algorithm for Gomoku (also called Gobang or Five in a Row)
MIT License
3.34k stars 970 forks source link

现在的模型似乎没法在 15*15 上的棋盘上训练出一个好的 AI #140

Open selfboot opened 4 days ago

selfboot commented 4 days ago

看作者说考虑计算量问题,所以没在 15*15 的棋盘上训练。 但是现在算力不是问题,我用个人笔记本 M1 的 mac 训练,基本两天就能训练完。

但是棋盘大小改成 15*15,训练出来的 AI 不会堵棋,水平太差了。

尝试调了些参数,还是不行