对本项目与另一个相似项目在大棋盘训练效率上差异的疑问

junxiaosong / AlphaZero_Gomoku

An implementation of the AlphaZero algorithm for Gomoku (also called Gobang or Five in a Row)

MIT License

3.33k stars 970 forks source link

Open QvQQ opened 6 years ago

QvQQ commented 6 years ago

据该说明描述，其在笔记本上训练两天达到不错的水平，并在持续训练后打败了弈心。

junxiaosong commented 6 years ago

简单看了下该项目的说明，感觉和效率最相关的是两个方面，一是它的self-play和MCTS部分都是用C++实现的，这是最耗时的部分；二是看说明它支持多进程并行；不过即使有这些优化，能够在一台笔记本上就训练得到打败奕心的模型还是挺刷新认知的。。。

tml104 commented 5 years ago

简单看了下该项目的说明，感觉和效率最相关的是两个方面，一是它的self-play和MCTS部分都是用C++实现的，这是最耗时的部分；二是看说明它支持多进程并行；不过即使有这些优化，能够在一台笔记本上就训练得到打败奕心的模型还是挺刷新认知的。。。

请问这个多进程并行指的是什么？也就是说目前这个项目的train是多线程进行mcts来下完一局，而另外的那个项目在train时可以同时下多盘棋吗？

shssqjs commented 4 years ago

简单看了下该项目的说明，感觉和效率最相关的是两个方面，一是它的self-play和MCTS部分都是用C++实现的，这是最耗时的部分；二是看说明它支持多进程并行；不过即使有这些优化，能够在一台笔记本上就训练得到打败奕心的模型还是挺刷新认知的。。。

打败弈心不难的吧，如果是无禁手的，ai执白棋因为自带必胜谱不可能赢，执黑棋的话优势非常大，我觉得打败他的白棋不难的