Population Based Training of Neural Networks

PaperCommunity / Deep-Reinforcement-Learning

1 stars 4 forks source link

Open initial-h opened 5 years ago

initial-h commented 5 years ago

这篇文章思想简单，效果不错，实验结果也在情理之中。除了算法，其算力起到了很重要的作用。比如RL的实验里worker数量是10-80个，MT里是32个，GAN里是45个，这个算力普通实验室要做类似工作代价还是比较高的。不过在当前的大环境下，没有算力确实是寸步难行，特别是RL。

initial-h commented 5 years ago

之后读到很多Multi-Agent或者并行训练的文章，都会提到这个算法，比如第一视角多人游戏(Quake III Arena Capture the Flag)的超人表现，NeurIPS2018首届多智能体竞赛(The NeurIPS 2018 Pommerman Competition)的冠军算法,DeepMind团队ICLR 2019 conference paper的2V2足球,甚至星际争霸II里的AlphaStar，都运用了类似方法。