请问如何提升使用GPU训练时的效率

junxiaosong / AlphaZero_Gomoku

An implementation of the AlphaZero algorithm for Gomoku (also called Gobang or Five in a Row)

MIT License

3.33k stars 970 forks source link

不知道你看的是不是这个issue #15 ，正如你说的，训练过程中绝大部分时间都在进行self-play。如果你说的训练效率是指运行时间的话，目测增大mini-batch的size对训练时间的帮助不大。如果说潜在问题的话，因为目前是每自我对战一局就会sample一个mini-batch的数据训练更新一次，在这种情况下增大mini-batch的size就意味每个数据被采样用来训练的次数会增多，有增加过拟合的可能。当然这些都是我想想的，你可以实际动手实验为准。

junxiaosong / AlphaZero_Gomoku

请问 如何提升使用GPU训练时的效率 #45

请问如何提升使用GPU训练时的效率 #45