Open Joker2770 opened 6 years ago
1、让训练可以中断,中断后可从断点继续训练; 2、分布式训练,以集中多台计算机资源进行训练(参考:http://zero.sjeng.org/ ); 3、保存自对弈数据(棋谱)。
谢谢你的建议,第一条是现在已经支持的,在创建TrainPipeline时把init_model参数指定为之前训练保存的模型就可以了;第二条分布式训练在好几个issue里都有过讨论,我这边估计短时间内没时间添加了,欢迎有兴趣的童鞋实现;第三条如果有需要的话可以在train.py里很容易保存。
感谢耐心解答
1、让训练可以中断,中断后可从断点继续训练; 2、分布式训练,以集中多台计算机资源进行训练(参考:http://zero.sjeng.org/ ); 3、保存自对弈数据(棋谱)。