junxiaosong / AlphaZero_Gomoku

An implementation of the AlphaZero algorithm for Gomoku (also called Gobang or Five in a Row)
MIT License
3.25k stars 965 forks source link

一些个人建议 #61

Open Joker2770 opened 6 years ago

Joker2770 commented 6 years ago

1、让训练可以中断,中断后可从断点继续训练; 2、分布式训练,以集中多台计算机资源进行训练(参考:http://zero.sjeng.org/ ); 3、保存自对弈数据(棋谱)。

junxiaosong commented 5 years ago

谢谢你的建议,第一条是现在已经支持的,在创建TrainPipeline时把init_model参数指定为之前训练保存的模型就可以了;第二条分布式训练在好几个issue里都有过讨论,我这边估计短时间内没时间添加了,欢迎有兴趣的童鞋实现;第三条如果有需要的话可以在train.py里很容易保存。

Joker2770 commented 5 years ago

感谢耐心解答