PaperCommunity / Deep-Reinforcement-Learning

1 stars 4 forks source link

Population Based Training of Neural Networks #9

Open initial-h opened 5 years ago

initial-h commented 5 years ago

这篇文章思想简单,效果不错,实验结果也在情理之中。除了算法,其算力起到了很重要的作用。比如RL的实验里worker数量是10-80个,MT里是32个,GAN里是45个,这个算力普通实验室要做类似工作代价还是比较高的。不过在当前的大环境下,没有算力确实是寸步难行,特别是RL。

initial-h commented 5 years ago

之后读到很多Multi-Agent或者并行训练的文章,都会提到这个算法,比如第一视角多人游戏(Quake III Arena Capture the Flag)的超人表现,NeurIPS2018首届多智能体竞赛(The NeurIPS 2018 Pommerman Competition)的冠军算法,DeepMind团队ICLR 2019 conference paper2V2足球,甚至星际争霸II里的AlphaStar,都运用了类似方法。