junxiaosong / AlphaZero_Gomoku

An implementation of the AlphaZero algorithm for Gomoku (also called Gobang or Five in a Row)
MIT License
3.25k stars 965 forks source link

对本项目与另一个相似项目在大棋盘训练效率上差异的疑问 #70

Open QvQQ opened 5 years ago

QvQQ commented 5 years ago

请参见该项目的说明 https://github.com/zhongjn/gomokuer/blob/master/README.md

据该说明描述,其在笔记本上训练两天达到不错的水平,并在持续训练后打败了弈心。

junxiaosong commented 5 years ago

简单看了下该项目的说明,感觉和效率最相关的是两个方面,一是它的self-play和MCTS部分都是用C++实现的,这是最耗时的部分;二是看说明它支持多进程并行;不过即使有这些优化,能够在一台笔记本上就训练得到打败奕心的模型还是挺刷新认知的。。。

tml104 commented 5 years ago

简单看了下该项目的说明,感觉和效率最相关的是两个方面,一是它的self-play和MCTS部分都是用C++实现的,这是最耗时的部分;二是看说明它支持多进程并行;不过即使有这些优化,能够在一台笔记本上就训练得到打败奕心的模型还是挺刷新认知的。。。

请问这个多进程并行指的是什么?也就是说目前这个项目的train是多线程进行mcts来下完一局,而另外的那个项目在train时可以同时下多盘棋吗?

shssqjs commented 4 years ago

简单看了下该项目的说明,感觉和效率最相关的是两个方面,一是它的self-play和MCTS部分都是用C++实现的,这是最耗时的部分;二是看说明它支持多进程并行;不过即使有这些优化,能够在一台笔记本上就训练得到打败奕心的模型还是挺刷新认知的。。。

打败弈心不难的吧,如果是无禁手的,ai执白棋因为自带必胜谱不可能赢,执黑棋的话优势非常大,我觉得打败他的白棋不难的